证券时报新闻

让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

金融市场

每10份音频就有8份被“胡编”?OpenAI语音转委派具被曝存紧要裂缝

发布日期:2024-11-03 19:01    点击次数:97

  

  财联社10月28日讯(裁剪 潇湘)生成式东谈主工智能领域的领军者OpenAI,曾吹嘘其东谈主工智能转委派具Whisper具有接近 “东谈主类水平的踏实性和准确性”。

  有关词,跟着该转委派具在九行八业被越来越多地擢升使用,其问题似乎也正启动突显——字据业内媒体对十多位软件工程师、树立东谈主员和学术盘考东谈主员的采访,如今Whisper所存在的一个紧要裂缝已愈发障翳苛刻:它很容易会诬捏大段翰墨,致使是整段句子。

  这些业内群众默示,一些诬捏出的翰墨——在行业内被称为“幻觉”,可能包括种族言论、暴力措辞,乃至皆备杜撰出的医疗提议。

  群众们越来越回顾这种“胡编乱造”可能形成严重效果,因为Whisper现时正被全球多个行业用于翻译和转录采访本体、生成文本以及为视频制作字幕。诚然OpenAI曾告诫不应在“高风险领域”使用该用具,但现在一些好意思国医疗中心都正启动使用基于Whisper的用具,来记载患者与医师间的对话。

  据频繁使用Whisper的盘考东谈主员和工程师默示,他们在责任中频繁会遭逢该用具出现“幻觉”。举例,密歇根大学的又名盘考东谈主员在盘考世界会议的转录准确率时发现,他所审核的每十份音频转录中,便有八份存在“幻觉”。

  一位机器学习工程师则称,在他分析的100多个小时的Whisper转录中,他领先发现能够有一半存在“幻觉”。第三位树立东谈主员指出,在他用Whisper创建的26000份记载中,险些每一份都发现了胡编乱造的风景。

  即使是在那些录制致密的疏漏音频样本里,问题曾经经存在。在最近的一项盘登科,筹算机科学家们在审查的朝上13000个明晰音频片断中发现存187个存在“幻觉”问题。

  盘考东谈主员默示,这种趋势将导致在数百万段灌音中出现指不胜屈的造作转录。

  效果严重

  曾在拜登政府携带白宫科技计策办公室责任的Alondra Nelson默示,这种造作可能会形成“尽头严重的效果”,尤其是在病院里。

  现在,包括明尼苏达州的曼卡托诊所和洛杉矶儿童病院在内的朝上30000名临床医师和40个卫生系统,已启动使用法国AI疗养公司Nabla基于Whisper打造的用具。

  Nabla公司的首席时间官Martin Raison默示,该用具字据医学语言进行了微调,以转录和归来医师与病东谈主间的互动。该用具转录的就诊记载现在已多达约700万次。该公司官员还指出,他们知谈Whisper会产生幻觉,并正在起劲科罚这个问题。

  现在担任普林斯顿高级盘考院素质的Nelson默示,“莫得东谈主但愿出现误诊。(该领域)应该有更高的措施。”

  现在,Whisper还被用于为聋东谈主和听力顽固者制作字幕——这是一个越过容易因出现造作转录而堕入窘境的东谈主群,因为聋东谈主和听力顽固者皆备无法识别“荫藏在总计文本中”的诬捏本体。

  这种幻觉在Whisper中的纷乱存在,已促使广博群众、主意者和OpenAI前职工敕令好意思国政府斟酌制定东谈主工智能纪律。他们指出,OpenAI至少需要科罚这一裂缝。本年2月因回顾公司的发展标的而从OpenAI离职的工程师William Saunders就默示,若是OpenAI精辟优先科罚这个问题,这个问题似乎是不错科罚的。而若是你弥远把它放在那儿,而东谈主们对它的功能过于自信,并把它集成到总计这些其他系统中,那就有繁重了。

  诚然大无数树立东谈主员都以为转委派具不能幸免会拼错单词或出现其他造作,但不少工程师和盘考东谈主员默示,他们从未见过其他东谈主工智能转委派具像Whisper同样容易产生幻觉。

  现在,该用具已被集成到OpenAI旗舰聊天机器东谈主ChatGPT的某些版块中,同期亦然甲骨文和微软云筹算平台的内置居品,为全球数千家公司提供工作。它还可用于将文本转录和翻译成多种语言。

  仅在上个月,开源东谈主工智能平台HuggingFace上的一个Whisper最新版块就被下载了420多万次。该平台的机器学习工程师Sanchit Gandhi默示,Whisper是最流行的开源语音识别模子,从招呼中心到语音助手,都内置了Whisper。

  康奈尔大学素质Allison Koenecke和弗吉尼亚大学素质Mona Sloane,现在已盘考了他们从卡内基梅隆大学的盘考贵寓库TalkBank中赢得的数千个疏漏音频片断。他们发现,近40%的幻听是无益的或令东谈主担忧的,因为话语者的痛快可能被曲解或污蔑。

  盘考东谈主员并不折服Whisper和近似用具产生幻觉的原因,但软件树立东谈主员默示,这些胡编乱造赓续发生在出现停顿、配景声息或音乐播放时。OpenAI此前在网上露馅的信息中曾提议,不要在方案情境中使用Whisper,因为准确性上的裂缝会导致戒指上的昭彰裂缝。

  而针对最新爆料,有OpenAI发言东谈主修起称,OpenAI会在接下来的模子更新中加入相应的响应机制。

海量资讯、精确解读,尽在新浪财经APP

牵扯裁剪:王许宁



Powered by 证券时报新闻 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024