【API 进阶之路】做 OCR 文字识别,谁说必须要有 AI 工程师?

发布于: 2020 年 09 月 18 日

摘要:有些功能还真不能光凭自己的直觉和认识,来自一线的声音才是最真实的用户需求。比方说名片录入的需求。



在公司技术委员会副主席这个位置上干了有几个月了,期间,我一方面给研发团队整理各种文档资料,做技术沉淀;一方面给市场/运营帮了几次忙,用技术解决业务问题。上周又解决了一个业务难题,估计是考虑到升职加薪也不能太频繁,老板就奖励了我7天带薪假期,让我自己安排。



(上集故事请查看:《破圈,用一个API代替10人内容团队》)



程序员的工作时间不是996就是007,这突然有了假,干点啥去呢?疫情期间也不能出去浪,有日子没回老家了,回去看看吧。



躺在老家院子里的摇椅上,我妈养的中华田园犬在身边绕来绕去,晃晃悠悠地吃了睡睡了吃,日子虽然无聊,倒也难得清闲。



叮~同样是做研发的高中同学发不脱同志给我打电话,约我晚上去学校旁边吃烧烤。说走就走,到了地方我看见这小子,紧了紧头上的帽子,赶紧坐下。



几杯酒下肚,聊起大家的近况,发不脱表示出了对我的羡慕,“真羡慕你在北京工作,开发的都是些有意思的产品,不像我,待在老家,每天就是围绕销售的需求,让干啥就干啥,实在是没劲,一点成就感都没有。就比如最近销售提了个需求,让我给做一个自动识别名片的功能,你说这玩意能有啥用?”



自动识别名片?现在谁还用名片,不都是微信联系了么,最多也是弄个小程序,一扫码就有自己的个人信息了,多方便。



我说完,发不脱也说:“对啊,现在谁还用名片,所以这个需求销售那边一个月里提了三四次,都被我们给拒绝了,做了也没价值。”



正说到这儿,我看着隔壁桌来了2个小伙子,俩人不太熟的样子,一见面又是握手又是寒暄,最后交换了名片才坐下。这名片难道还真有市场?



看完这一幕,我突然有了点想法,跟发不脱说,还是帮销售实现这个需求吧,又不费事,几行代码就解决了,万一人家有用呢。



没想到发不脱差点跟我急了:“几行代码?你闹呢?文字识别欸,我们又没有AI工程师,没那个技术能力!”



这还不好解决么,说着我掏出手机,打开浏览器进入了华为云API Explorer,搜索“名片识别”,找到对应API,按照接口说明把调用方式发给了发不脱,可不就几行代码的事么。



过去了大概10来天,我已经回公司上班了,发不脱给我发信息:“哥们,谢谢你啊,这个名片识别的功能上线之后才发现,销售们每天能收回来一百多张名片,以前要手动录入CRM,现在扫完就能直接录入了,老板因为这个还给我涨工资了呢,大家还打听我什么时候学的AI,哈哈。”



通过这件事我也意识到,有些功能还真不能光凭自己的直觉和认识,来自一线的声音才是最真实的用户需求。如果你也需要名片识别这个功能,“名片识别API”调用方式如下,拿走不谢。



步骤一:开通服务



1. 进入文字识别OCR主页,单击“立即使用”,进入文字识别Console控制台。



2. 选择服务所在的区域。系统默认显示“华北-北京四”,根据各服务的部署区域选择对应区域,开通与调用的服务必须在同一个区域。



3. 在左侧服务列表中单击需要使用的服务,单击“开通服务”。 服务开通成功后,界面显示已开通的服务。





步骤二:调试服务



通过API Explorer可进行快速调试。



在API Explorer点击文字识别。





我们先看看调用这个API都需要点啥:





看上去获取到名片图片的64位编码或者url就能调用了。



举个栗子



接下来我们就拿“诸葛亮”的名片调试一下。





1、 获取名片图片的64位编码:把“诸葛亮”放进Chrome浏览器里,按F12,在弹出窗口点Sources,选中“诸葛亮”的名片文件,这样就能看到名片的64位编码了。



2、 双击选中图片的base64编码信息,“Ctrl+C”复制,然后粘贴到 API Explorer里,点击“调试”,响应结果里就把“诸葛亮”的名片信息都识别出来了~(注意不可使用鼠标右键方式进行复制)





了解更多华为云API信息:“免费下载创新加速利器《华为云API精选手册》



【拓展阅读】



  1. 【API进阶之路】因为不会创建云服务器,我被实习生摆了一道

  2. 【API进阶之路】前浪的绝地反击与自我证明

  3. 【API进阶之路】甩锅大会上,我是如何绝地求生的

  4. 【API进阶之路】一个技术预案,让老板当场喊出了“奥利给”

  5. 【API进阶之路】万万没想到,一个技术方案帮实习生追到了运营妹子!

  6. 【API进阶之路】一个技术盲点,差点让整个项目翻车

  7. 【API进阶之路】老板给我涨薪30%!如何通过SDK接口搞定千万级流量直播

  8. 【API进阶之路】半天搞定百万条手机号归属地查询,竟影响了公司战略方向!

  9. 【API进阶之路】无法想象!大龄码农的硬盘里有这么多宝藏

  10. 【API进阶之路】高考要考口语?一场10w+刷屏活动是如何用多模态评测API做出来的

  11. 【API进阶之路】帮公司省下20万调研费!如何巧用情感分析API实现用户偏好调研

  12. 【API进阶之路】逆袭!用关键词抽取API搞定用户需求洞察

  13. 【API进阶之路】破圈,用一个API代替10人内容团队

  14. 【API进阶之路】用API打造一条自动化内容生产流水线



——活动推荐——



华为云已经成为全球主要云服务供应商,在华为云上开放了2400+ API,包括计算、存储、网络、应用服务、软件开发服务、视频、数据库、EI智能等74+产品,如何利用这些丰富强大的API快速开发自己的应用和服务,成为大家关注的热点。



华为云API学习赛,为入门初学者量身定制的学习平台,以赛带学,学以致用。无需代码,只需下载体验模板,按操作文档操作即可完成作品。参赛、邀请都有丰富奖品,还有机会拿P40 5G手机超级激励!!点击下方链接即可报名参加。



API入门学习赛·AI人脸识别





API入门学习赛·探险寻宝之旅





点击关注,第一时间了解华为云新鲜技术~



发布于: 2020 年 09 月 18 日 阅读数: 27
用户头像

传送门:https://bbs.huaweicloud.com/ 2020.07.14 加入

华为云开发者社区,提供全面深入的云计算前景分析、丰富的技术干货、程序样例,分享华为云前沿资讯动态,方便开发者快速成长与发展,欢迎提问、互动,多方位了解云计算!

评论

发布
暂无评论
【API进阶之路】做OCR文字识别,谁说必须要有AI工程师?