Microsoft
活动+
 

台湾可作亚洲医疗AI大数据领头羊 黄彦男看好语音AI与NLP

黄彦男认为台湾有很多利基切入点,各界可以积极尝试。蔡腾辉

即便台湾的医学电子数码化已经做了20多年,中央研究院信息创新研究中心(CITI)主任及特聘研究员黄彦男认为,台湾医学研究单位要收集医学病历资料还是不太容易。不过台北医学大学医学科技学院院长李友专说,健保资料从1995年开始全数落实,所以1995年后出生的人,基本上已可以称为「全健康数码人」,透过这23年的资料累积,几乎能说全方位的数据都能收集。

台湾可发展利基医疗AI大数据

虽然台湾的医疗巨量资料取用有限制,但再加上台湾人体生物资料库(Taiwan Bio Bank)从2012年11月8日至2019年5月31日止,已经收集了11万4千多人次的生物资料,因此黄彦男认为,台湾在发展生技医疗大数据与人工智能上,还是有相当大的优势。

美国IBM推出Watson For Oncology,但主要内容是收集以白种人为主的癌症医学文献资料,再利用专家系统(Expert System)推论,提供医师不同治疗建议,也因为这样,黄彦男说,台湾更应该切入亚洲黄种人的医学治疗文献集成系统,不仅在资料收集上能更快速,在创新技术导入研发也能快速实证。

语言AI医疗应用

在语言转译方面,黄彦男认为深度学习(Deep Learning)在语音辨识和影像辨识上,是相当适用且好用的技术。针对提升医病关系的语言创新系统,黄彦男说,当医师看诊时,口说中文但病历却能够以英文输入,将来一定是可行的。

同时也观察到Google与Amazon的翻译系统,虽然尚无尽善尽美,但对话和翻译的准确度越来越高,黄彦男看好未来语音AI的发展和应用。不过语言数据还是会有地区性的差别,也因此客制化与在地化的语音AI应用,也会是未来较能快速落地的关键。

提升信息安全:NLP追踪假消息

针对日益增多的网络抹黑文章、假消息、信息安全漏洞、讯息过滤、洗脑信息的不当传递,黄彦男说,为了防止网络成为这些恶意信息传递的滥用媒介,中心2019下半年也会以研究的角度切入,透过自然语言处理(NLP)找寻消息「来源」,藉由网络爬虫、网络机器人、人工智能追踪新闻来源、相关性、因果关系。

黄彦男表示,计画的宗旨就是要在假消息(Disinformation)影响民众之前,就要侦测出来可能的单位、内容、目标,才能达到预防甚于治疗的信息安全预防效用。

蔡腾辉

DIGITIMES电子时报智能医疗主编蔡腾辉Mark Tsai
专注研究智能医疗产品技术服务导入场域时,所遇到的困难症结与如何克服要点。
精通中英德语,热爱挑战与Swing Dance。
Facebook:DIGITIMES智能医疗

作者更多专栏

  •     按赞加入DIGITIMES智能医疗粉丝团
更多关键字报导: 中央研究院 黄彦男 自然语言处理