"); //-->
现在的人脸识别技术已经得到了非常广泛的应用,支付领域、身份验证、美颜相机里都有它的应用。用iPhone的同学们应该对下面的功能比较熟悉。

iPhone的照片中有一个“人物”的功能,能够将照片里的人脸识别出来并分类,背后的原理也是人脸识别技术。
这篇文章主要介绍怎样用Python实现人脸检测。人脸检测是人脸识别的基础。人脸检测的目的是识别出照片里的人脸并定位面部特征点,人脸识别是在人脸检测的基础上进一步告诉你这个人是谁。
好了,介绍就到这里。接下来,开始准备我们的环境。
准备工作
本文的人脸检测基于dlib,dlib依赖Boost和cmake,所以首先需要安装这些包,以Ubuntu为例:
$sudoapt-getinstallbuild-essentialcmake $sudoapt-getinstalllibgtk-3-dev $sudoapt-getinstalllibboost-all-dev
我们的程序中还用到numpy,opencv,所以也需要安装这些库:
$pipinstallnumpy $pipinstallscipy $pipinstallopencv-python $pipinstalldlib
人脸检测基于事先训练好的模型数据,从这里可以下到模型数据,dlib.net/files/shape_predictor_68_face_landmarks.dat.bz2下载到本地路径后解压,记下解压后的文件路径,程序中会用到。
dlib的人脸特征点
上面下载的模型数据是用来估计人脸上68个特征点(x,y)的坐标位置,这68个坐标点的位置如下图所示:

我们的程序将包含两个步骤:
第一步,在照片中检测人脸的区域
第二部,在检测到的人脸区域中,进一步检测器官(眼睛、鼻子、嘴巴、下巴、眉毛)
人脸检测代码
我们先来定义几个工具函数:
defrect_to_bb(rect): x=rect.left() y=rect.top() w=rect.right()-x h=rect.bottom()-y return(x,y,w,h)
这个函数里的rect是dlib脸部区域检测的输出。这里将rect转换成一个序列,序列的内容是矩形区域的边界信息。
defshape_to_np(shape,dtype="int"): coords=np.zeros((68,2),dtype=dtype) foriinrange(0,68): coords[i]=(shape.part(i).x,shape.part(i).y) returncoords
这个函数里的shape是dlib脸部特征检测的输出,一个shape里包含了前面说到的脸部特征的68个点。这个函数将shape转换成Numpyarray,为方便后续处理。
defresize(image,width=1200): r=width*1.0/image.shape[1] dim=(width,int(image.shape[0]*r)) resized=cv2.resize(image,dim,interpolation=cv2.INTER_AREA) returnresized
这个函数里的image就是我们要检测的图片。在人脸检测程序的最后,我们会显示检测的结果图片来验证,这里做resize是为了避免图片过大,超出屏幕范围。
接下来,开始我们的主程序部分
importsys
importnumpyasnp
importdlib
importcv2
iflen(sys.argv)<2:
print"Usage:%s<imagefile>"%sys.argv[0]
sys.exit(1)
image_file=sys.argv[1]
detector=dlib.get_frontal_face_detector()
predictor=dlib.shape_predictor("shape_predictor_68_face_landmarks.dat")
我们从sys.argv[1]参数中读取要检测人脸的图片,接下来初始化人脸区域检测的detector和人脸特征检测的predictor。shape_predictor中的参数就是我们之前解压后的文件的路径。
image=cv2.imread(image_file) image=resize(image,width=1200) gray=cv2.cvtColor(image,cv2.COLOR_BGR2GRAY) rects=detector(gray,1)
在检测特征区域前,我们先要检测人脸区域。这段代码调用opencv加载图片,resize到合适的大小,转成灰度图,最后用detector检测脸部区域。因为一张照片可能包含多张脸,所以这里得到的是一个包含多张脸的信息的数组rects。
for(i,rect)inenumerate(rects):
shape=predictor(gray,rect)
shape=shape_to_np(shape)
(x,y,w,h)=rect_to_bb(rect)
cv2.rectangle(image,(x,y),(x+w,y+h),(0,255,0),2)
cv2.putText(image,"Face#{}".format(i+1),(x-10,y-10),
cv2.FONT_HERSHEY_SIMPLEX,0.5,(0,255,0),2)
for(x,y)inshape:
cv2.circle(image,(x,y),2,(0,0,255),-1)
cv2.imshow("Output",image)
cv2.waitKey(0)
对于每一张检测到的脸,我们进一步检测脸部的特征(鼻子、眼睛、眉毛等)。对于脸部区域,我们用绿色的框在照片上标出;对于脸部特征,我们用红色的点标出来。
最后我们把加了检测标识的照片显示出来,waitKey(0)表示按任意键可退出程序。
以上是我们程序的全部
测试
接下来是令人兴奋的时刻,检验我们结果的时刻到来了。
下面是原图

下面是程序识别的结果

可以看到脸部区域被绿色的长方形框起来了,脸上的特征(鼻子,眼睛等)被红色点点标识出来了。最后想要了解更多关于Python发展前景趋势,请关注扣丁学堂python培训官网、微信等平台,扣丁学堂IT职业在线学习教育平台为您提供最新的Python视频教程系统,通过千锋扣丁学堂金牌讲师在线录制的Python视频教程课程,让你快速掌握Python从入门到精通开发实战技能。扣丁学堂Python技术交流群:816572891。
专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们
相关推荐
三菱FX系列PLC教程 77 —— FX系列的PID运算指令
求助有关手机方面的问题
PIC18F6390_PIC18F6490_PIC18F8390_PIC18F8490单片机
PIC18FXX2 增强型闪存单片机
请教各位高手,VxWork中如何得到已分区硬盘的分区情况。。
Imec 展望摩尔定律未来十五年:七年后迎来晶体管技术全新迭代
PIC18F2331_PIC18F2431_PIC18F4331_PIC18F4431 单片机
爱立信携手 Net Feasa 布局海事网络 融合公网级通信与智能体 AI 赋能航运
英伟达 2027 财年 Q1 财报:营收利润双创新高,AI 算力需求持续爆发
侨兴HA8188(20)P/TSD(LCD)型 IC卡管理电话机电路
三星电机斩获 1.5 万亿韩元硅电容大单
ROHM 可配置电源方案:适配 ADAS 与车载计算平台
东芝推出新款车载MCU,集成电机驱动功能
PIC18F87J10 系列单片机
三菱FX系列PLC教程 80 —— FX系列的模拟量输入指令
三菱FX系列PLC教程 79 —— FX系列的模拟量开关设定指令
三菱FX系列PLC教程 78 —— FX系列的方向开关指令
BOE(京东方)OLED技术赋能联想YOGA Air 14 Ultra 定义超轻薄AI PC新标杆
求助有关手机方面的问题
求助有关手机方面的问题
Anthropic将向SpaceX支付近450亿美元以获取算力
机箱内部互联新标准:eUSB2 与 eUSB2V2 技术详解
中天信HA738(19B)P/TSGFM(LCD)型电脑计费电话机电路
TCLHL868(II)P/TSD型数字录音电话机电路(b)
三菱FX系列PLC教程 76 —— FX系列的外部IO制备指令
美信通HL9918(5)P/TDL(LCD)型数字录音电话机电路(b)
东京大学研发反铁磁结构 实现 40 皮秒自旋存储开关
HA323(1E)P/TSD-lECD型电脑计费电话机电路
求助各位高手
PIC编译器