初识deep learning的时候,经常只是把它看成一种更好一些的机器学习分类算法而已;实际上,也可以用一个时兴的说法——它是一种“像人脑一样的”神经元计算。前一种说法大大低估了深度学习可以胜任的应用类型;而后一种说法又言过其实的认为它的能力已经超出了普通的人工智能,基于它的应用已经可以自如的处理实际问题了。
可能对于基于深度学习应用更为恰当一些的认识角度是——它改善了人机交互界面。深度学习系统确实看起来似乎具备了某种可以匹敌生物大脑的能力,例如,它们可以很有效的辅助进行通常由人类甚至是动物曾经被用来完成的工作。需要指出的是,深度学习系统于传统的字符计算系统确实有着很大的区别,这种差异就有如人类的思考方式与计算机的计算方式之间的区别。
然而,深度学习系统本质上还是依赖于传统的计算技术构建的,因此,深度学习系统也和普通计算机一样可以不知疲倦的持续高效工作。计算机在进行高精度的符号运算和推理方面大大超过人类,然而,深度学习系统还不具有处理复杂符号运算的能力,虽然它们本身就是植根于这种能力的。
利用深度学习构建的应用看上去非常的具有科幻色彩。这里仅从目前已经开发出来的神奇的深度学习应用中抽选一小部分。
为盲人开发的照片内容解读app
Facebook开发了这款手机app用来为盲人描述一幅照片的内容。
http://www.wired.com/2015/10/facebook-artificial-intelligence-describes-photo-captions-for-blind-people/
同声传译
微软Skype已经能够实时的将语音翻译为多种语言,几乎就和星际迷航里的那款是一样一样滴。
http://blogs.skype.com/2014/12/15/skype-translator-how-it-works/
邮件自动回复
Gmail已经可以根据你之前的行为自动的回复邮件了。
http://www.wired.com/2015/11/google-is-using-ai-to-create-automatic-replies-in-gmail/
物品识别
Moodstocks (Google已收购)已经可以使用手机来辨别不同的物品。
http://www.slideshare.net/CdricDeltheil1/moodstocks-mobile-image-recognition-paris-tech-talks-6
识别照片中场景的地理位置
Google已经实现了仅仅通过分析照片场景识别出照片所拍摄的地理位置。
https://www.technologyreview.com/s/600889/google-unveils-neural-network-with-superhuman-ability-to-determine-the-location-of-almost/
照片收藏夹整理
Google Photos已经可以将你的相册按照公共分享的一些主题整理为不同的收藏夹。
https://www.youtube.com/watch?v=JuFtW1PSYAU
对照片进行分类
Yelp实现了可以自动将照片分类为不同业务类别的功能。
http://engineeringblog.yelp.com/2015/10/how-we-use-deep-learning-to-classify-business-photos-at-yelp.html
自动驾驶汽车
业余爱好者可以在几个小时内“教”会它的车如何自动驾驶。
http://www.bloomberg.com/features/2015-george-hotz-self-driving-car/
谱曲
音乐可以被基于不同的编写风格被编写出来。
http://web.mit.edu/felixsun/www/neural-music.html
模仿画家风格的绘画
可以模仿著名画家的绘画风格进行作画。
https://nucl.ai/blog/neural-doodles/
* 新材料发现*
借助于深度学习发现新的材料。
http://www.nature.com/articles/srep02810
玩视频游戏
Google DeepMind已经可以创建出仅仅通过观察就能够学会如何去玩视频游戏的系统。
http://www.wired.co.uk/article/google-deepmind-atari
世界冠军级别的围棋对弈能力
Google DeepMind开发了一个可以通过自己和自己对弈来学习新策略的围棋对弈系统。
http://www.scientificamerican.com/article/how-the-computer-beat-the-go-master/
人脸识别
人脸识别现在可能已经有点不新鲜了。
https://cmusatyalab.github.io/openface/
http://gitxiv.com/posts/fDJ7nHHou57aLEjBQ/the-megaface-benchmark-1-million-faces-for-recognition-at
生成诱骗点击的标题
一个RNN网络可以被训练用来生成诱骗点击的标题。
https://larseidnes.com/2015/10/13/auto-generating-clickbait-with-recurrent-neural-networks/
黑白照片着色
一个系统被训练用来为黑白照片着色。
http://richzhang.github.io/colorization/
实时的将图像中的文字进行翻译
Google开发了一款手机应用可以将从照片中找到的文字自动翻译成可以看懂的文本。
https://research.googleblog.com/2015/07/how-google-translate-squeezes-deep.html
键盘击键预判
Swiftkey正在设计制造一种手机键盘,它使得输入更加简单快捷。
http://www.slashgear.com/swiftkey-neural-alpha-predicts-what-youll-type-08408912/
三维物品分类
http://3dshapenets.cs.princeton.edu/
手势识别
不同手势的含义可能将会成为我们和各种无屏电器设备一种新的交互方式。
https://engineering.purdue.edu/cdesign/wp/deephand-robust-hand-pose-estimation/ https://atap.google.com/soli/
将照片中的人物面容变为笑脸
SmileVector可以拍下一幅人像照片然后将其中人物面容变为笑脸。
https://www.engadget.com/2016/06/27/twitter-bot-plasters-creepy-smiles-on-celebrities-faces/
拟人沟通
Google创建了一个消息系统,它具有更加自然的沟通能力。
https://research.googleblog.com/2016/05/chat-smarter-with-allo.html
增强现实-人脸跟踪
Baidu创建了一个可以利用深度学习跟踪人脸的手机应用,该应用可以将一幅三维的面具图像覆盖在人脸上。
http://research.baidu.com/happy-halloween-baidu-research-introduces-faceyou/
仓库优化
一个深度学习系统被训练用来学习在仓库中存取货物的优化路径,这个系统比很多传统的运筹优化方法要快速。
https://devblogs.nvidia.com/parallelforall/optimizing-warehouse-operations-machine-learning-gpus/
其他视觉应用 https://github.com/kjw0612/awesome-deep-vision
实时表情转换
Stanford最近研究了如何将你的表情转移到另外一个人的脸上。这不是一个深度学习应用,让我疑惑的是,一个深度学习系统是不是也可以实现类似的功能。
http://graphics.stanford.edu/~niessner/thies2015realtime.html realtime facial transfer
译者著:原作者对于深度学习的有些认识可能有待商榷,然而毕竟整理了很多有趣的深度学习应用,于是翻译过来留存启发。
源网址:http://www.deeplearningpatterns.com/doku.php/applications