一、基础概念
像素(Pixel):图像的最小单位,包含颜色和亮度信息。
灰度图(Grayscale):单通道图像,像素值表示亮度(0-255)。
RGB/HSV:颜色空间模型(RGB:红绿蓝;HSV:色调饱和度明度)。
二、图像处理
滤波(Filtering):平滑(如高斯滤波)或锐化图像(如拉普拉斯算子)。
边缘检测(Edge Detection):Canny、Sobel等算法识别物体轮廓。
形态学操作(Morphology):膨胀(Dilation)、腐蚀(Erosion)用于二值图像处理。
三、特征提取
SIFT/SURF:传统局部特征描述子(尺度与旋转不变性)。
HOG(方向梯度直方图):用于物体检测(如行人检测)。
CNN(卷积神经网络):通过卷积核自动提取分层特征(如ResNet、EfficientNet)。
四、模型与架构
卷积层(Convolutional Layer):局部感受野的权重共享操作。
池化(Pooling):降维操作(如最大池化保留显著特征)。
U-Net:医学图像分割常用的编码器-解码器结构。
YOLO(You Only Look Once):单阶段实时目标检测算法。
五、任务类型
分类(Classification):识别图像类别(如ImageNet竞赛)。
目标检测(Object Detection):定位并分类物体(输出边界框)。
语义分割(Semantic Segmentation):像素级分类(如区分道路与车辆)。
实例分割(Instance Segmentation):区分同类物体的不同实例(Mask R-CNN)。
六、评估指标
mAP(平均精度均值):目标检测中综合衡量精度与召回率。
IoU(交并比):预测框与真实框的重叠面积占比。
PSNR/SSIM:图像重建质量的客观评价指标。