2023春季实习面试

南京百家云科技有限公司

  1. 自我介绍;

    (第一个项目)

  2. 介绍使用YOLOv3的项目并介绍YOLOv3;

  3. YOLOv3的图像输入大小是什么;

  4. YOLOv5、YOLOv8都出来了为什么要用YOLOv3;

  5. 对YOLOv5熟悉吗,说一下YOLOv3与YOLOv5的区别,YOLOv5中加了哪些结构,介绍一下;

  6. YOLOv3最后模型的输出是什么;

  7. 多分类目标和多目标分类一样吗;多分类和多标签一样吗,若不一样有什么区别;

  8. softmax的作用是什么;为什么进行目标分类时要用softmax;

  9. 若需要给一个目标打多个标签时,应该怎么做;

  10. 更加熟悉YOLOv3还是faster-RCNN,介绍一下(回答的是faster-RCNN);

  11. faster-RCNN中图像的输入大小是什么;

  12. 介绍一下faster-RCNN的发展史;

  13. 你看的faster-RCNN源码中,都进行了哪些数据处理(包括在图像尺寸不满足输入大小时,图像上的标注框应该如何进行缩放);

    (第二个项目)

  14. 介绍另外一下另外一个项目;

  15. 该项目中所使用的数据集是什么,有多少张图片,共有多少种类,类别都是什么;

  16. 数据集使用了哪些数据增强,使用了什么库,为什么要这样做;知道这些数据增强的底层实现吗;

  17. 在项目中使用了什么方式读取图片?OpenCV和PIL这两种读取图片的方式有什么区别;

  18. 项目中使用了深度可分离卷积,介绍一下深度可分离卷积,并介绍一下它的作用;

  19. 在该项目中模型共有多少层,输入的图像大小是多少,进行了多少次下采样;

  20. 在该项目中使用了注意力机制,介绍一下;

  21. 在该项目中最后的输出是怎么样的;

    (深度学习)

  22. 介绍一下深度学习的激活函数,有哪些优缺点;

  23. 梯度下降函数有哪些;在哪会用到梯度下降;梯度下降的参数有哪些;

  24. 学习率的作用是什么;

  25. 如何设置batch_size;图像处理在什么位置做;batch_size会调用什么函数;

  26. 目前在做什么,介绍一下它的原理,代码是如何实现的(说的是NF);

  27. 生成对抗网络的生成器和判别器的关系;

  28. tensorRT在转换的时候会转换成什么类型的模型;

  29. 在转换的过程中遇到了什么问题,是如何解决的;

  30. 为什么tensorRT会减少显存,增加计算量;

  31. 一阶段和两阶段的目标检测模型有什么区别;

    (算法)

  32. 快排;

    (其他)

  33. 你从上一次实习经历中得到了什么;

  34. 在上家公司实习你做了什么工作;
  35. 在上家公司做线材的缺陷检测使用了什么相机,光源;用了几个相机;相机和光源的位置是如何摆放的;是否用到了图像拼接;
  36. 在上家公司使用的可视化系统是自己开发的吗;
  37. 在上家公司实习的项目中遇到了什么问题;是如何解决的;
  38. 学习过flask框架吗;

总结:这次面试时间长达100分钟,感觉比较好,虽然问的问题比较多,有一部分没有回答上来,快排也写的稀碎,但总体还是好的,能够感觉到面试官特别重视。

梅卡曼德机器人(上海)

  1. 自我介绍;
  2. 防止过拟合的方法有哪些;
  3. 介绍一下你的项目(三个都介绍了一下);
  4. 你多次提到了残差结构,介绍一下残差结构是怎么样的;
  5. 学习率一般设置多少,有没有自己的调参经验;过大或过小会导致什么后果;
  6. 介绍一下图像分类,语义分割和实例分割有什么区别;

总结:这个面试很快就结束了,面试官介绍说梅卡曼德的研发主要是在北京,上海这边主要是做项目,比如采集图像2D或3D图像,交给专门的标注公司去做,标注公司做完后检查他们做的是否合格,然后通过项目区去选择合适的方法,用现成的软件设置一下超参数就可以去训练。

武汉TCL工业研究院

  1. 自我介绍;
  2. 介绍一下项目(几乎没有发散去问);
  3. 介绍一下YOLOv3;
  4. YOLOv3的三种不同尺寸的特征图分别是下采样多少;预测何种类型的物体;
  5. YOLOv3的一个grid cell产生几个anchor;
  6. YOLOv3中正样本和负样本是如何划分的;
  7. 介绍一下faster-RCNN;
  8. 在faster-RCNN中正负样本是如何选择的;

哈啰

  1. 介绍一下做过比较有意义的项目;

  2. focal loss的公式,以及各个参数的含义;

  3. 残差结构的作用;

    回答:可以有效的防止过拟合。

    为什么可以有效的防止过拟合?

    回答:残差结构的分支结构,当网络层数过深时,残差结构可以使带有卷积操作的分支短路,从而减少模型的深度。(其实这样回家是不对的)

    应该是因为当是普通结构时y=f(x),而当是残差结构时y=f(x)+x,…..;

  4. 熟悉的目标检测网络有哪些;

  5. 归一化层的作用;
  6. 目标检测网络中,一阶段的网络和两阶段的网络主要的差别在哪;
  7. 介绍一下在faster-RCNN中的RPN层;
  8. 在faster-RCNN中,坐标误差用的什么损失函数;
  9. smooth L1损失背后的原理;
  10. 在YOLOv3中,如果预测框超出了图像区域应该怎么处理;
  11. 在YOLOv3中,预测的xywh的偏移量的值的范围是什么;
  12. 在YOLOv3中的损失函数是什么;
  13. 在YOLOv3中,计算坐标时log和e是怎么计算的;

总结:面试官特别好,每提问一个问题在回答完后都会说出他对回答的评价,以及他觉得的答案,态度也特别好;在面试完以后介绍了一下如果面试通过后的工作内容,并从在校生的视角进行对比,就纠正认识上的差距;并且还给出了今后学习上的一些建议。

问他实习生的核心竞争力是什么:1.实习时间的长短;2.技术;3.态度

正式找工作的核心竞争力:1.技术;2.学习能力(他说这个面试很难体现出来,但也会采用一些方法)

最后还说知道学生在学校基本上只学习python,要多学一下C++,不然以后找工作很不利,尽量多知道一些算法的底层逻辑,这样更有利于以后的发展。

其他面试提出的有价值的问题:

  1. 在对缺陷进行语义分割时,若缺陷的面积很小且不规则,如何进行测量;

需要尽快学习的地方

  1. 学习传统的图像处理方法;
  2. 学习C++;
  3. 学习OpenCV;
  4. 学习3D视觉技术;
  5. 学习PCL点云库;
  6. 学习关于视觉相关的C++技术;
  7. 对YOLO系列和faster-RCNN系列的原理要理清楚,可以不细看代码,但原理一点要搞清楚;
  8. 找关于以上技术的开源项目进行学习,并掌握;
  9. 学习transformer、VAE、NF等模型的原理代码;
  10. 掌握mobilnetv2和unet的模型结构和设计思想;
  11. 完善简历上的项目细节;