1.2 基本概念

优质

小牛编辑

135浏览

2023-12-01

基本概念

人脸检测

人脸检测是指从一副静态的图像中检测并标记出人脸所在的区域, 并且给出表示人脸的矩形坐标(左上角坐标和右下角坐标, 其中图像左上角坐标是(0,0), 右下角坐标是(n,m), n,m分别为图像的像素宽度和高度)。在0.2, 0.3版的服务中增加了人脸的性别与年龄信息。
人脸检测有着广泛的用途, 比如(1): 智能驾驶辅助系统,能自动识别出道路前方的人脸, 并及时提醒驾驶人注意前方行人(2): 相机中添加人脸检测算法, 可以实时捕捉画面中人脸的位置并自动对焦。

人脸识别

人脸识别的前提是能够检测到人脸的存在,即人脸检测, 然后识别检测到的人脸是不是已知的某个人。这里面要用到人脸对比, 从各个角度多方问比对两个人脸的相似性。
人脸识别最典型的应用是刷脸支付,刷脸门禁。用户只需要向系统提供一些底片(用户本人脸部清晰照片),即可在下次通过刷脸完成支付,门禁等。

物体识别

给定一张静态图片,系统可以分析出照片中存在的物体, 因为准确率不能做到100%, 所以也会给出相应判断的的置信度。

自然语言机器翻译

机器翻译系统是支持翻译大量文本的在线服务，将文本从“源”语言译成另一种"目标"语言的过程。自从2010年代早期，新的人工智能技术- 深度神经网络（又称深度学习），已经使得翻译达到较高的精准度。现在支持7种语言的互相翻译

Ocr文本识别以及图片翻译

OCR（optical character recognition）文字识别是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，然后用字符识别方法将形状翻译成可搜索，可处理，可翻译的文本的服务。我们也提供直接从含有待翻译语言的图片直接翻译为含有位置坐标信息的目标语言的服务。