China’s Baidu reveals generative AI chatbot based on language model bigger than GPT-3
중국 #바이두 , GPT-3보다 큰 #언어모델 기반 생성 #AI챗봇 공개
아마도 이중 언어 봇은 중국 외부에서는 ERNIE, 중국 내에서는 Wenxin Yiyan으로 불릴 것입니다.
Probably bilingual bot will be called ERNIE outside China, Wenxin Yiyan within
Tue 7 Feb 2023 // 06:31 UTC
이름에 "AI"가 있고 AI를 하이퍼스케일 클라우드의 초점으로 삼은 중국 웹 거대 기업 바이두(Baidu)가 올해 후반에 생성형 AI 챗봇을 출시할 것이라고 밝혔습니다.
중국언론은 출시를 보도했고 #Baidu 는 The Register에 이를 확인했습니다.
바이두 대변인은 "이 회사는 챗봇을 대중에게 공개하기 전인 3월에 내부 테스트를 완료할 계획"이라고 밝혔습니다.
봇의 이름은 "Wenxin Yiyan文心一言" 또는 영어로 "ERNIE Bot"입니다.
대변인은 봇이 2019년에 처음 제안된 Ernie(지식 통합을 통한 향상된 표현) 모델을 기반으로 한다고 덧붙였습니다.
우리는 Ernie가 " #언어이해 #언어생성 (ERNIE 3.0 Titan) 및 텍스트를 이미지로 생성(ERNIE-ViLG)합니다.”
대변인은 "ERNIE가 다른 언어 모델과 차별화되는 점은 광범위한 지식을 방대한 데이터와 통합하여 뛰어난 이해력과 생성 능력을 제공하는 능력"이라고 덧붙였습니다.
봇이 무엇을 할 수 있을 지는 알 수 없지만 Baidu는 수년 동안 #ChatGPT와 매우 흡사하게 들리는 무언가에 대한 야망을 설명했습니다.
어제 언급했듯이 Baidu는 "모델이 합리적이고 일관된 텍스트를 공식화할 수 있도록 제어가능한 학습 알고리즘과 신뢰할 수 있는 학습 알고리즘을 제안했다"고 논의했습니다.
2021년에는 2,600억 개의 매개변수가 있는 사전 학습 언어 모델인 "ERNIE 3.0 Titan"을 세부적으로 제공하는 등 이러한 시스템을 제공하기 위해 많은 노력을 기울였습니다.
ChatGPT는 1,750억 매개변수 GPT3 모델을 사용합니다.
ERNIE/文心一言은 영어와 중국어 이중 언어입니다.
2021년 프리프레스 논문[PDF]은 ERNIE의 성능을 자세히 설명하고 모델이 많은 작업에서 GPT-3을 포함한 모든 경쟁 제품보다 우수하다고 주장합니다.
ChatGPT가 출시된 후 몇 달 동안 ChatGPT와 경쟁 챗봇이 인터넷 검색, 소프트웨어 산업 및 쓰기와 관련된 모든 형태의 인간 노력의 미래를 대표한다는 열광적인 추측을 불러일으켰습니다.
구글이 월요일에 Bard라는 이름의 자체 생성 챗봇을 발표한 것은 ChatGPT에 대한 관심과 마이크로소프트가 자체 AI 기술을 공개할 것으로 예상되는 화요일 행사를 위해 발행한 초대장에 대한 다소 패닉적 반응으로 널리 알려져 있습니다.
Baidu의 발표는 확실히 주목을 받았습니다.
회사가 ERNIE/文心一言을 발표한 후 몇 시간 만에 회사의 주가가 약 15% 급등했습니다.
Chinese web giant Baidu, which has “AI” in its name and has made AI the focus of its hyperscale cloud, has revealed it will launch a generative AI chatbot later this year.
Chinese media reported the launch and Baidu confirmed it to The Register.
“The company plans to complete internal testing in March before making the chatbot available to the public,” a Baidu spokesperson wrote.
The bot will be named “Wenxin Yiyan文心一言” or "ERNIE Bot" in English.
The spokesperson added that the bots are based on the Enhanced Representation through Knowledge Integration (Ernie) model first proposed in 2019. We were told Ernie “expands into a series of advanced big models that can perform a wide range of tasks, including language understanding, language generation (ERNIE 3.0 Titan), and text-to-image generation (ERNIE-ViLG).”
“What sets ERNIE apart from other language models is its ability to integrate extensive knowledge with massive data, resulting in exceptional understanding and generation capabilities,” the spokesperson added.
Just what the bot will be capable of is not known, but Baidu has over the years described its ambitions for something that sounds an awful lot like ChatGPT. As we noted yesterday, Baidu has discussed "proposed a controllable learning algorithm and a credible learning algorithm to ensure the model can formulate reasonable and coherent texts". It’s done the hard work to deliver such a system, having in 2021 detailed “ERNIE 3.0 Titan” – a pre-training language model with 260 billion parameters.
ChatGPT uses the 175-billion parameter GPT3 model.
ERNIE/文心一言 is bilingual in English and Chinese. A pre-press paper [PDF] from 2021 details the performance of ERNIE, and asserts that the model is superior to all rivals – including GPT-3 – at many tasks.
In the months since ChatGPT’s release it has generated fevered speculation that it and rival chatbots represents the future of internet search, the software industry, and any form of human endeavour that involves writing.
Google’s Monday announcement of its own generative chatbot named Bard is widely held to be a somewhat panicked response to interest in ChatGPT, and perhaps to an invitation Microsoft issued for a Tuesday event expected to reveal its own AI tech.
Baidu’s announcement certainly turned heads: the company’s share price spiked around 15 percent in the hours after the company revealed ERNIE/文心一言. ®