城市站点
> EasyDL平台(要让人人能AI的百度EasyDL,现在怎么样了?)
详细内容

EasyDL平台(要让人人能AI的百度EasyDL,现在怎么样了?)

时间:2022-08-25 19:56:23     人气:279     来源:www.zhongshaninfo.com     作者:爱发信息
概述:......

李林 发自 凹非寺

量子位出品 | 公众号 QbitAI

百度非常愿意和全球有梦想的开发者一起,来实现一个理想:Everyone can AI。”

2018年7月的百度Create开发者大会上,李彦宏一句话赢来满场掌声。

百度有一款工具便与这个理想息息相关——定制化训练及服务平台EasyDL。它的目标,就是让零算法基础的用户,也可以基于自身业务需求和数据,快速训练专属的定制化AI模型。


转眼已是2019,EasyDL怎么样了?

如果你对它的印象还停留在刚刚推出之时,认为它不过是个能自动训练图像分类模型的试验性产品,那么,你的认识需要刷新一下了。

2018年,EasyDL有两大核心进展。


http://www.jsyunjun.com/file/upload/tt1999/999.jpg

产品和技术层面,它支持的任务已经覆盖图像分类、物体检测、文本分类、声音分类。

而且,EasyDL还新增用离线SDK来部署模型功能,用户不仅能通过调用接口来使用在平台上训练出来的模型,还可以下载封装了模型的SDK,嵌入终端使用,无需联网就能运行。

应用落地方面,官方数据显示,截止2018年12月31日,EasyDL平台总注册用户数超过10万名,应用企业覆盖22个行业。

全面发展的EasyDL,正在一点一点地削低人工智能开发门槛,助力各行各业升级转型,也让更多普通个人参与进来,用AI改变生活。

削平门槛,人人AI


2018年,无论从企业的行动上,还是从政府的政策鼓励上来看,AI发展的主旋律都离不开两个字:

落地。

工厂流水线上的质量检测、商店里的自动识别结账、无处不在的智能审核……

越来越多来自不同领域的企业,开始“想AI”。他们面前,摆着重重关卡。

先是人才关

人民日报》海外版此前有报道称,中国人工智能人才缺口超过500万。这样的供需关系也导致人工智能人才价格水涨船高,《第一财经》在2018年冬天的一篇报道中提到,企业招应届生的薪水比上年提高了10%-20%,甚至有公司给博士生的薪水从上一年的年薪50万元涨到了80万。

招不到、招不起,似乎已成常态。

就算高价请来AI大牛,还有业务关摆在面前,“落地”依然遥远。要把前沿技术与相对传统的业务实践结合起来,可是个难题。

怎样跨越这两道关卡?

百度的第一个答案,是百度大脑AI开放平台上的一系列标准API,包括语音识别、图像识别、自然语言处理等等,供企业直接使用。

http://www.jsyunjun.com/file/upload/tt1999/999.jpg

这的确帮企业绕开了人才一关,但放到实际业务场景里,百度发现,很多客户都有个性化需求,统一的API倒在了业务关前。

比如说,一个通用的图像识别API,面对细分场景的需求实在无能为力:想让它看图识别家居风格?判断工人有没有穿工服?厨师有没有戴帽子口罩?Sorry,没学过。

要是懂业务的自家员工,能用自家数据,定制训练符合自家业务场景需求的AI模型就好了……

可是这些员工可能并不熟悉深度学习,如何跨越技术门槛?

这就要看“优化版”答案了:2017年11月,百度上线自动化机器学习平台EasyDL。几乎是同时,谷歌也瞄准了这个方向。2018年1月,谷歌开始测试自动化机器学习产品AutoML。

两家在人工智能领域大力布局的巨头,都进入了这个领域。

EasyDL作为定制化模型训练和服务平台,用自动的算法削平了定制AI模型的技术门槛,用户需要做的,是理清需求,准备数据。

定制AI模型4步走

用EasyDL训练机器学习模型,分4步:


整个流程都是可视化图形操作,不用写一行代码,就能训练出AI模型。

训练出来的模型,也并不比专业人士差。

EasyDL训练的模型,有2/3以上准确率都超过了90%,在比较简单的任务上,比如为传统制造业的鲽鱼科技检测键盘组装是否合格,识别准确率就超过了99%。

而且,训练起来,可能比专业人士还快。拿1000张图片使用EasyDL训练一个图像识别模型最快只需要8分钟;拿1000条音频来训练声音分类模型,只需15分钟;使用3000条数据训练文本分类模型,也只需8分钟。

4步自动定制高精度模型,是由什么样的技术支撑的呢?

为了实现全流程自动化,百度构建了机器学习从训练到上线的工作流引擎AI Workflow,能将大数据成熟的工程系统与人工智能分布式模型训练相结合。

easydl

http://www.jsyunjun.com/file/upload/tt1999/999.jpg


而模型训练的工作,就要交给迁移学习和自动模型搜索(Auto Model Search)了。

训练的原理,简单来说是个“举一反三”的过程:拿来一个经过大规模数据集预训练的模型,把它学到的“知识”应用到特定的业务场景上。帮它理解这个场景的,是来自实际业务的新数据集。

这个新数据集并不需要太大,比如说在图像识别任务里,用户只需要为每个类别准备20到100张图像就够了。

自动训练的过程,则比人类专家训练模型有效率得多。为了尽可能找到性能最好的模型,自动模型搜索算法会选择多个预训练模型,再搭配不同的批次大小、学习率等超参数,发起多个训练。然后,再筛选出最适合的模型。


另外,EasyDL的算法还会自行通过early stopping来降低过拟合风险。除了模型训练之外,EasyDL平台还包括了数据集管理、标注、版本控制等功能。

这样,那些本来离人工智能有点遥远的企业、机构、甚至爱好者,都具备了训练模型的能力。

进击的2018:落地各行各业

就是这个一站式的人人AI平台,从发布到现在,一年出头的时间实现了巨大的跨越。

EasyDL在2017年11月初次亮相时,只有图像识别一种能力,其他数据,概不能学。


一年出头的时间,它增加了定制化声音分类和文本分类两大类新功能,还有新的部署方式:离线SDK。

声音分类可以用在安防领域来监测异常声音,也能用在野外通过声音分辨不同物种;文本分类则用来给文章分类、审核文字内容有没有包含违法信息等等。

而离线SDK,则应对着企业实际应用中的现实问题:网络可能不好,数据可能不方便传到云端,对检测速度可能有极高要求。这些,就催生了把模型部署到本地硬件上的离线SDK。

现在,EasyDL平台总注册用户数超过10万名,覆盖的行业有22个,包括零售、安防、互联网内容审核、医疗、法律、会计、餐饮、购物等等。


在工业领域,它就已经是个很成熟的质检员了。在一家名叫柳州源创的传统企业里,检验工业喷油嘴瑕疵这道工序就已经不再需要人力——EasyDL训练的算法代劳了,每年节约的人力成本有60万元。


又比如地板公司圣象,也通过EasyDL把人工智能用到了生产中。以前,生产出来的地板需要工人一片片肉眼识别是否合格,再分拣出来。而现在,他们部署了EasyDL训练出来的算法,用摄像头自动判断地板质量、机器自动分拣。“比做了3年的老员工还要精准”。


在安防监控领域里,它也是个厉害的监测者。说广东佛山的供电局,就在用EasyDL训练的模型,通过摄像头时刻监控输电线路有没有遇到吊车、挖掘机等安全隐患。长江沿岸,也有摄像头结合EasyDL训练出的算法监控着非法采砂、破坏河道的船只。


最新上线的文本分类模型也已有落地应用。货运平台货拉拉就在用EasyDL文本分类,来筛选优质用户留言,精准定位目标客户,提升整体的运营效率。

也有商家用EasyDL训练的模型审核商品陈列是不是符合要求,中国食品药品鉴定研究院在用它识别中草药,还有供电局用它监控输电线路隐患……

案例之多,应用场景之丰富,远不是这样几段文字所能展现。

而这种广泛应用,也正体现出了EasyDL与企业需求的契合。它只需少量数据,就可以训练出模型,然后落地验证效果。这样,既为企业省去了找深度学习工程师的成本,又大大降低了因为可行性不确定而带来隐患。

在AI变革生产力的大潮中,EasyDL这样的工具让众多中小企业有了参与感:要想让AI成为各行各业新的生产力,不能仅仅依靠行业里的头部公司做定制化的大单,这样一个大单需要AI公司动用少则几十人,多则几百人的团队,耗资上千万,很难规模化。

EasyDL展示了百度AI开放生态的另一种玩法:用平台的思路,做规模化的AI落地。


EasyDL这个定制化工具,是百度大脑AI开放平台一站式AI解决方案的一部分。

整套解决方案中,有深度学习框架PaddlePaddle等底层技术,供有算法实力的公司使用;有能满足零技术基础企业个性化需求的EasyDL和Unit智能对话训练与服务平台、模板化文字识别平台;还有各行各业应用场景的成套解决方案,直接满足企业比较普遍的需求。

迎接全民开发者时代

其实不止企业,很多既没有基础,又单打独斗的个人,也在用EasyDL进行实践,融入AI无处不在的时代。

2018年5月以来

http://www.jsyunjun.com/file/upload/tt1999/999.jpg

,百度举办了多场EasyDL挑战赛,参赛者有来自一线的工程师、工人、律师、会计、护士等。

他们从自己的职业和生活出发,用EasyDL设计了各种脑洞大开的AI模型。有识别口红色号模型,用来拯救直男,有共享单车损坏识别,有小麦识别病症模型……这些AI模型虽然较难产生巨大的经济效益,做出巨大的科技突破,但是却能解决个人经验积累、信息不对称的问题。

比如说在医疗行业,医生这个职业的高度专业性,让技术的落地难上加难。好在,也有医生在根据自己的需求,定制出了属于医生的AI模型。

援藏医生陈静飞就是这样做的。藏地牧区,寄生虫病高发,而检验人员缺乏。于是,他就运用EasyDL技术,几个月建立了一套寄生虫识别系统,可以识别显微镜下十几种寄生虫卵,测试准确率超过97%,可以媲美20年临床经验的专家。


也有久病成医者。亲人不幸患病的个人开发者郭晶,就开发了医学诊断模型,想辅助医生分析病情,减少失误。他组建团队用EasyDL开发了AI辅助诊断和管理App,仅是EasyDL比赛就参加了两次,还获得了第四届中国研究生移动终端应用设计创新大赛三等奖。

此前,很多人谈到AI的时候,要么恐惧,要么就抱有过高的期待,不如直接试一试EasyDL,在尝试中看看AI究竟能做什么,培养起AI时代的AI素养。

Next…

覆盖了这么多用户、积累了各个行业的应用之后,EasyDL的下一步是什么?

答案是更多模型定制新功能。百度透露,未来将会在平台易用性、模型类型的丰富度上持续精进,与各行业合作伙伴一起壮大EasyDL平台。

继续扩大用户群、扩展到更多行业,也是必然。

http://www.jsyunjun.com/file/upload/tt1999/999.jpg

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

?'?' ? 追踪AI技术和产品新动态

(声明: 网站所收集的部分公开资料来源于互联网,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。 )
  • http://www.jsyunjun.com/file/upload/tt1999/999.jpg

    4月25日,百度大脑推出EasyDL商品检测专业版和语音识别自训练平台,并发布13款AI通用新能力和5项技术升级。一个月前,百度大脑刚刚开放了24项AI技术。其中,EasyDL平台支持图像分类、物体检测、文本分类、声音分类四类模型的定制训练;语音自训练平台支持

    http://www.jsyunjun.com/file/upload/tt1999/999.jpg

    个人及企业开发者零代码自助训练语言模型,支持语音助手等多种应用场景。(北京商报)

    http://www.jsyunjun.com/file/upload/tt1999/999.jpg

    easydl

  • 8月22日,第五期百度大脑开放日EasyDL专场在北京中关村创业大街百度大脑创新体验中心举办。本期开放日上,百度大脑AI开放平台发布和更新多项技术能力,包括深度学习框架、一站式内容审核平台、OCR识别等。


    其中,作为此次开放日的重点内容,“硬核”能力爆表的EasyDL更是让开发者们大呼过瘾。同时,中国专利信息中心、茅台博物馆、农信互联等合作伙伴的技术负责人也在现场分享了使用EasyDL的实践案例,向开发者、行业人士们展现了百度大脑领先的AI技术能力和AI产业化加速落地的成果。


    百度大脑EasyDL:零算法基础获取高精度AI模型,Everyone Can AI

    各行业各场景在AI落地应用中,往往需要定制

    http://www.jsyunjun.com/file/upload/tt1999/999.jpg

    AI能力。然而训练一个高精度且符合业务需求的AI模型,首先需要学习专业知识及相关经验,其次传统训练需要大量标注数据,从数据采集到数据标注周期较长,并且模型往往需要在实际业务中部署后才能真正反馈出业务效果,模型迭代少则一个月,多则数月。

    而百度大脑推出的EasyDL平台,正是一款零算法基础定制高精度AI模型的训练和服务平台,用户根据可视化页面提示,通过创建模型-上传并标注数据-训练模型-发布模型四步操作,即可获得公有云API、端计算离线SDK、软硬一体方案,快速集成在业务场景中。百度AI技术生态部高级产品经理李景秋分享了一系列EasyDL的经典案例,并现场演示了如何快速训练一个常见物体识别模型并集成在EdgeBoard中离线计算,向参会者们充分展示了EasyDL的产品功能及优势。


    据李景秋在会上介绍,EasyDL是百度大脑在2017年底推出的一站式模型训练与服务平台。目前,EasyDL通用版已支持图像分类、物体检测、文本分类、声音分类、视频分类等模型类型的定制训练,而EasyDL零售行业版可针对特定行业问题,在通用版的基础上,提供结合了行业洞察的数据、算法、工具、预制技能等一系列服务,实现更高效的AI模型生产。因其零算法基础即可上手使用的超低门槛特性,目前EasyDL产品服务已经广泛应用到工业、安防、互联网、零售、物流、智能硬件、教育 、 医疗、电商等各个行业,成为诸多企业的首选。

    例如杭州气象局用EasyDL训练打造的智能“看云”气象观测系统,通过训练云量、云状、霜露等多个模型,有效提升了气象观测的密度和效率,识别准确率普遍超过85%以上;北京新桥结合历史积累的道路及病害图像(塌陷、裂缝等),分别使用百度EasyDL图像分类、物体检测算法,训练道桥类型和道桥病害类型等多个模型,用于全国日常道路桥梁维护巡查;还

    http://www.jsyunjun.com/file/upload/tt1999/999.jpg

    有爱包花饰利用百度EasyDL物体检测算法,辅助人工在箱包X光图片中实现自动检测遗落在包内的针、金属等部件,让箱包生产流水线质检人员告别“放大镜”“老花眼”。 EasyDL真正在用科技,一次次帮劳动者减轻工作的繁杂与沉重。

    李景秋还预告了EasyDL即将发布的图像分割模型以及即将支持服务器本地化部署。其中,EasyDL新增图像分割模型类型支持非矩形(圆形、直线、多边形)标注,支持目标形状不规则、且不便用正矩形框标注的业务场景,可应用于工业瑕疵检测、道路检测等场景。EasyDL图像分类、物体检测云服务高性能模型也即将支持预测服务在服务器端本地部署。

    用EasyDL加速企业AI转型

    活动当天,百度大脑的合作伙伴分别通过实际案例,与大家分享了不同领域的企业是如何通过百度EasyDL的赋能,实现自身业务的智能创新升级。


    easydl

    (从左至右分别为:中国专利信息中心软件设计师崔亚坤、茅友公社APP负责人张瑞想、农信互联高级工程师孙凌俊)

    中国专利信息中心软件设计师崔亚坤在现场分享时表示:“在知识产权保护方面,针对互联网信息总量大、更新快知识产权侵权假冒行为的识别专业性强,人工发现线索的方式投入大、效率低、不及时、权利人维权成本高的新挑战,EasyDL可以根据专利保护领域训练出定制化的解决方案,有效解决图片分类、图片中的

    http://www.jsyunjun.com/file/upload/tt1999/999.jpg

    物体检测等问题,结合百度大脑的文字识别、图像搜索、NLP语义处理等能力,有效提升了自动化审核流程的工作效率。”

    茅友公社APP负责人张瑞想介绍,茅友公社APP是集茅台知识在线交流和茅台酒及其配套产品购买一体的应用。为了更好的挖掘中国酒文化与茅台文化的历史脉络,选择使用了EasyDL平台,并且仅用三周就完成模型的多次迭代,快速落地AI识酒的定制化图像识别模型。每款酒型只用了不到100张瓶身图片,就训练出了高达99%的模型效果。

    农信互联高级工程师孙凌俊也在会上肯定了百度EasyDL的行业价值,他说到:“自己研发AI技术投入成本比较高,落地不确定性也大。而EasyDL平台可用率高,无运维成本,只需少量数据即可训练出猪棚场景定制模型。基于百度大脑EasyDL物体检测,可以减少猪场管理人力,减少人与猪的接触频次,降低发病风险,便于远程进行管理,有效改善了养殖业目前生产效率低问题。”

    不断创新升级 百度大脑向全民“AI”时代迈进

    “百度大脑自2016年底开放,目前已是服务规模最大的AI开放平台,有超过130万开发者使用,开放了超过210项核心技术能力,并面向广泛的企业和开发者,不断降低着AI应用落地的门槛。”百度AI技术生态部高级产品经理娄双双在活动现场讲到。本期开放日除了重点介绍了有关EasyDL的内容之外,一如既往介绍了百度大脑8月最新开放和升级的能力。


    在深度平台方面,Paddle Lite 全新发布,重点加强了多平台多硬件的支持能力,新增各类硬件 Kernel 70种,并在易用性和性能方面都有所大幅提升,值得一提的是,其新增对华为海思 NPU 的深度支持,成为首个支持华为NPU在线编译的框架。

    为了帮助开发者更好地学习和应用深度学习技术, 百度大脑除了有已经被广大开发者熟知的可以提供大量的免费算力资源的AI

    http://www.jsyunjun.com/file/upload/tt1999/999.jpg

    Studio亿元算力支持计划之外,飞桨特别开设的深度学习在线集训营PaddleCamp也准备了全新实战课程,只需要4-6周时间,助力开发者深度学习从入门到精通。百度大脑还建立了国内最完备的深度学习企业培训体系:包括企业深度学习实战营AI快车道以及“首席AI架构师培养计划”黄埔学院;国内最活跃的深度学习研发精英俱乐部:包括“飞桨博士会”和 “飞桨领航团”等活动也都在持续开展中。同时,每年举办10余场赛事的百度AI Studio人工智能竞赛也在火热进行中,总奖金超百万元。

    在今年百度AI开发者大会上,全面跨越升级为软硬一体的AI大生产平台的百度大脑5.0,拥有最全面的AI开放能力,并不断丰富与升级。此次开放日上,在OCR文字识别方面,有3款产品能力升级,包括名片识别的识别率和识别速度提升;二维码/条形码识别的识别率提升以及手写识别的识别率提升。截至目前,OCR文字识别全系列已经有35款产品,可满足各类文档结构化应用场景。而在人体分析方面,人流量统计(动态版)能力升级,准确率提升至92%以上。在图像处理方面,新增图像拉伸恢复、风格转换能力,可赋能媒体、广告娱乐领域智能图像处理应用,不断提升用户体验,加强营销效果。

    在第五期开放日上,具有全方位、灵活、实时特性的一站式满足所有AI审核需求的百度大脑内容审核平台,此次也带来了全新功能升级,最核心的两项升级就是:打通EasyDL,支持审核模型定制、分钟级策略更新更及时。整合了百度大脑视觉、语音、语义等能力的百度大脑内容审核平台,专业的内容审核服务,可以帮助更多平台提升内容质量。


    语音自训练平台新增搜索模型、输入法模型的API调用方式,调用方式简单,适用于多平台多场景。据现场介绍,平台上线以来,已有医疗、金融、农业、教育、餐饮、物流、建筑、地产等多个行业客户,模型上线应用到业务数据采集录入、音频关键词质检、智能语音助手、呼叫中心等多个语音识别场景,专业领域的词汇识别率有效提升5-25%。


    在百度大脑的开放生态中,开发者一直是最为重要的一环,百度大脑在持续为AI开发者提供最新AI产品和案例分享,真正做到平等开放赋能。因此,在第五期的活动现场,百度大脑还发布了感恩回馈活动,100w调用量免费大赠送,还有更多产品限时折扣低至6折。


    http://www.jsyunjun.com/file/upload/tt1999/999.jpg

    百度大脑始终贯彻着“Everyone Can AI”的理念,不论是由于其操作简单、智能度高、覆盖面广、可定制化,深受广大用户及开发者喜爱的EasyDL平台,还是每个月定期更新升级的百度大脑开放日活动,百度大脑从未停止前进的脚步,这也充分体现了其希望能够在解决行业痛点的同时,更好的为有需求的企业提供更多服务,真正用领先的AI技术助力企业智能化转型,共同向AI时代迈进。

  • 阅读全文
    分享