当我和大模子做了盆栽一次通话

发布时间:2024-08-30 16:36:32    浏览:

[返回]

  江南体育功效深夜炸场三个月后,国内首个面向C端怒放的AI视频通线日,智谱发表,清言App将于8月30日正式上线“视频通话”功效,首批面向清言局部用户怒放,并同时怒放表部申请。“咱们会继续迭代并慢慢摊开周围,尽疾让全员都能够操纵。”智谱方面展现。本年5月,OpenAI率先掀起海浪,其全新一代旗舰天生模子 GPT-4o,无需借帮语音转文字功效,即可直接通过及时音视频,完成“真人般”地丝滑交互。随后,多家国表里大模子厂商纷纷疾速跟进,入手下手推出各样维持端到端及时多模态的AI功效。

  6月,AI首创公司Character.AI推出一项通话功效,同意用户与其人为智能脚色举办语音对线月,商汤科技正在WAIC 2024上,现场演示新模子日日新5o的及时音视频交互才略。8月9日,字节跳动旗下火山引擎发表,豆包大模子维持及时语音通话。而微软AI据称将正在本年岁晚具有及时的语音界面,同意全体动态的交互……

  只是,这些或都片刻不涉及及时视频功效盆栽,又或暂未对C端怒放。智谱最新上线的视频通话功效,也以是成为国内首个面向C端局部用户怒放的AI视频通话。

  正在举办最新版本更新后,掀开清言APP,即可正在主界面上的输入框旁看到一个“电话”图标,点击可进入及时音频通话盆栽,再点击通话界面的“视频”按钮,则可进入视频通话形式。

  甜头二,通话畅达,可随时打断。这个名叫“幼智”的帮理,正在通话流程中显示得尤其“像真人”,能阐明摄像头拍摄到的实质,也能听懂指令并确切履行,根基正在听到语音一两秒内即能给到回答盆栽,且即使一再打断“幼智”的话,它也能疾速响应。

  例如当咱们将视频画面临准一本书时,它能疾速识别出这本书的名字、作家,并举办闭系配景先容。入选中“画笔”按钮,还能够正在视频中圈出对应的物体或文字段落,完成更精准的提问妥协答。

  例如,当咱们正在前一次通话中,与“幼智”交换过绿植养护的话题,一段时候后再次掀开视频通话时,它会主动打答理,并首倡话题——“家里的木樨长得怎样样了?”

  当然,这个AI帮理,也出缺乏之处。例如,它并不是每一次识别都能极端确切,当咱们让它辨别极少盆栽时,它也许会将金鱼草误以为豆瓣绿,将未正在花期的木樨树误以为茉莉花。

  又例如,它片刻“只读到了初中水准”,也还没有联网搜罗的才略,当被问及极少胜过界限的题目时,则无法作答。

  但不难意念,跟着工夫的急迅起色和更多厂商对AI及时音视频目标的押注,犹如的AI帮理会越来越智能化。例如,通过与AI的及时音视频互动,用户能够让其充任生涯帮手,供给穿搭技艺、识别场景讲述配景故事;也能够让它成为职责伙伴,举办口试指挥、及时解读电脑屏幕代码、落成聚会纪要、分解杂乱数据图表;还能够举动研习搭子,及时读屏翻译、指点各科功课……

  8月25日至29日,为期5天的国际学问创造与数据开掘大会KDD 2024正在西班牙巴塞罗那举办。举动环球数据开掘规模汗青最修长、周围最大的国际顶级学术聚会,KDD 2024吸引了数千名来自寰宇各地的顶尖学者和著名企业代表参会,智谱 GLM 团队也正在这场大会上,先容了本身新一代的基座大模子——GLM-4-Plus。

  据先容,GLM-4-Plus 操纵了巨额模子辅帮构造高质料合成数据,以擢升模子机能;同时,诈欺PPO(Proximal Policy Optimization)有用有用擢升模子推理(数学、代码算法题等)显示。这也让其正在讲话阐明、指令遵从、长文本管理等方面的机能,都有进一步擢升。

  比方,正在讲话文本才略方面,智谱方面展现,GLM-4-Plus依然得到与GPT4o及405B参数宗旨Llama3.1相当的成果。

  目前,GLM-4-Plus 已正在智谱大模子怒放平台安放,企业和拓荒者近日起能够通过智谱怒放平台上的 API 挪用智谱最新的基座大模子。GLM-4V-Plus也将上线怒放平台,供给国内首个通用视频阐明模子 API。就正在这两天,CogVideoX-5B正式开源,同时此前

  。CogVideoX是由智谱AI拓荒的视频天生大模子,而CogVideoX-5B 模子相较于 CogVideoX-2B 具有更高的视频天生质料。其余,GLM-4-Flash目前也已全体免费,成为智谱怒放平台首个全体免费的大模子API。“智谱开源模子累计下载量现已打破2000万次。”智谱方面展现。当我和大模子做了盆栽一次视频通话

搜索