본문 바로가기
I.Coin Project

AI 할루시네이션 봇

by 게임혼 2024. 9. 17.

옥스퍼드에서 꾸준하게 발표하는 모양이다.

우선 현재까지는 데이터 표준치가 부족하면 답변을 하지 않는 것으로 처리했는데

에고라고 할지 지저표준모델(Low)이라고 할지 근간에 두는 데이터를 통해 판단의 방향을 정하는 것으로 보인다.

 

그래서 데이터 오염을 추구하는 경우에는 오히려 이런 환각이 특출난 모델을 통한 데이터 생산에 나서고 있다.

나는 이미 2023년 중순부터 신규 데이터의 30~40%가 오염되었다고 본다. 앞으로 검증되지 않는 자료의 생산은 더욱 많아질 것이고 AI의 지저표준모델에 수록될 것이다.

 

무단 수집 데이터의 오염은 필연이다. 은밀하고 조용하게 말이다.

 

일론 머스크가 오늘 X에 올리고 지운 글처럼 수많은 AI들의 균형적인 대답은 비틀리겠지 그럼 그 세력의 노력은 성공적이다. AI의 모델이 고도화 되면 될 수록 말이다.

 

대놓고 환각AI라고 할 수 없으니 일단 라마를 타자. 많이들 쓰고 있다. reddit에서도 자주 글이 나오고 있다.

 

어색한 표현은 RAG를 통해 좀 더 자연스럽게 변경한다.

 

곧 유료 검색 AI서비스가 시작될 것이기 때문에 데이터 오염은 더 많이 이루어질 것이고 이미 돌이키기엔 늦었을 것으로 보인다. 처음부터 공정한 데이터 사용이 기반이었다면 좋았을 텐데..작금의 AI기업들은 기술 발전을 빌미로 적을 많이도 만들었다.

 

앞서 데이터를 만들던 사람들이 바보는 아닐진데 그들의 피눈물을 담고도 독이 되지않길 바라는 것은 후안무치한 것이지.

 

앞으로 gpt는 월 비용 상승으로 기업별 AI지원금도 삭감될 것인데 AI 없이는 개발도 못하고 일도 못하는 사람이 속출하면 가관일 것이다.

 

나는 방관자로 남을 뿐이지만

'I.Coin Project' 카테고리의 다른 글

AI Actor 프로젝트 초안  (0) 2024.08.10
비트 종말 시나리오  (0) 2024.04.30
AI Renderer 구현  (0) 2023.05.23
시계열DB와 생성형 AI의 미래  (0) 2023.05.15
FIDO 1.0 tls + netty + B.C  (0) 2022.05.20