市場(chǎng)

OpenAI首推旗艦生成式AI模型GPT-4o 為ChatGPT聊天機(jī)器人提供更多功能

蓋世汽車 2024-05-22 13:04

蓋世汽車訊據(jù)外媒報(bào)道，OpenAI宣布推出新的旗艦生成式AI模型GPT-4o（“o”代表“omni”，即該模型處理文本、語音和視頻的能力）。根據(jù)演示視頻，它可以與用戶進(jìn)行近乎實(shí)時(shí)的語音對(duì)話，表現(xiàn)出類人的性格和行為。

OpenAI首推旗艦生成式AI模型GPT-4o 為ChatGPT聊天機(jī)器人提供更多功能

（圖片來源：OpenAI）

GPT-4o提供“GPT-4級(jí)別”智能，但速度更快，并改進(jìn)了GPT-4跨多種模式和媒體的能力。OpenAI首席技術(shù)官M(fèi)ira Murati表示：“GPT-4o可以跨語音、文本和視覺進(jìn)行推理。這非常重要，因?yàn)槲覀冋谘芯咳祟惻c機(jī)器交互的未來?！?/p>

GPT-4o極大地改善了OpenAI的人工智能聊天機(jī)器人ChatGPT的體驗(yàn)。該平臺(tái)長期以來一直提供語音模式，使用文本轉(zhuǎn)語音模型轉(zhuǎn)錄聊天機(jī)器人的響應(yīng)，但GPT-4o對(duì)此進(jìn)行了增強(qiáng)，讓用戶與更像助手一樣的ChatGPT進(jìn)行交互。

例如，用戶可以向GPT-4o支持的ChatGPT進(jìn)行提問，并在ChatGPT回答時(shí)打斷它。OpenAI 表示，該模型提供“實(shí)時(shí)”響應(yīng)能力，甚至可以識(shí)別用戶聲音中的細(xì)微差別，從而生成“一系列不同情感風(fēng)格（包括唱歌）”的聲音。

GPT-4o還升級(jí)了ChatGPT的視覺能力。現(xiàn)在，向它展示一張照片或桌面屏幕，ChatGPT可以快速回答相關(guān)問題，主題范圍包括“這段軟件代碼中發(fā)生了什么？”到“這個(gè)人穿什么牌子的襯衫？”Murati表示，這些功能未來將得到進(jìn)一步發(fā)展。目前，GPT-4o可以查看不同語言的菜單圖片并進(jìn)行翻譯。舉例來說，未來該模型可以支持ChatGPT“觀看”現(xiàn)場(chǎng)體育比賽，并向用戶解釋規(guī)則。

Murati表示：“這些模型變得越來越復(fù)雜，但我們希望實(shí)際交互體驗(yàn)變得更自然、輕松，并且客戶無需關(guān)注用戶界面，而只關(guān)注與ChatGPT的協(xié)作。在過去幾年里，我們一直非常專注于提高這些模型的智能，這是我們第一次在易用性方面真正邁出一大步。”

為了使先進(jìn)的人工智能在全球范圍內(nèi)更易于獲得和使用，GPT-4o的語言功能在質(zhì)量和速度方面得到了提高。現(xiàn)在，ChatGPT支持50多種語言（在新窗口中打開），包括注冊(cè)、登錄和用戶設(shè)置等。

OpenAI計(jì)劃在未來幾周內(nèi)首先向“一小群值得信賴的合作伙伴”提供GPT-4o新音頻功能支持。

來源：第一電動(dòng)網(wǎng)

作者：蓋世汽車

本文地址：http://www.cbbreul.com/news/shichang/231480

返回第一電動(dòng)網(wǎng)首頁 >

以上內(nèi)容轉(zhuǎn)載自蓋世汽車，目的在于傳播更多信息，如有侵僅請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除，轉(zhuǎn)載內(nèi)容并不代表第一電動(dòng)網(wǎng)（www.cbbreul.com）立場(chǎng)。

文中圖片源自互聯(lián)網(wǎng)，如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com（#替換成@）刪除。