전체 글1072 요즘 AI 데이터 오염 트렌드 기존에는 오염학습을 위한 생산에 중심이었다면 요즘은 일부에서 재미있는 시도가 있습니다. AI가 아니라 튜터를 공격하는 방식입니다. 추론모델 등장 이후로 AI의 데이터는 오염을 막기위해 다양한 방법을 도입하고 있습니다. 그러나 대부분은 인간 관리자를 통한 필터링이 무조건 들어가고 이를 이용한 공격법이 거론됩니다. 보편적인 결론이라는 것은 결국 개인적인 사고를 기반으로 다른 누군가의 의견을 참고할 수 있을 때 확정된다는 발상에서 착안된 공격법으로 AI튜터의 판단 근거를 오염시키는 방식으로 보여집니다. 대부분 역사적 기록에서 참고되는 내용을 인용하는 방법이며 시대적 가치관의 차이를 현재로 재포장하여 윤리적 정당성을 조절합니다. 가장 대표적인 부분이 역사적 관점의 차이이기 때문에 이 부분에서 대부분의 튜터들은 .. 2024. 11. 19. 향후 AI와 반AI의 대결은 어떻게 될까? 현재 무단수집 형태의 AI는 절대 멈출 수 없는 것으로 생각된다.천문학적인 돈이 걸린 상황에서 이를 중단하는 것은 창업멤버라 하더라도 불가능하기 때문이다. 이에 많은 피해자이자 크리에이터들이 다양한 방법으로 환각용 데이터를 생산하고 있다물론 일부 AI맹신자들의 검증되지 않은 자료도 덤이다 이렇게 수집된 데이터들은 언젠가 딱지를 받게 된다 그래서 AI진영에서는 수집 가능한 데이터를 표기하자는 이익보상형 캠페인을 시작할 것이다그러나 피해자들은 여기에서 수집 가능한 데이터를 오염시켜 생산 표기할 것이다해당 데이터를 신뢰할 수 없다고 판단되면 결국 다시 무단수집 형태로 바꿀 것이고이때 AI 코디네이터가 등장하게 된다 AI의 튜터로서 활동하는 신뢰할 수 있는 인간이 AI의 판단 근거를 제공하는 것이다결국 보상의 .. 2024. 10. 19. AI 할루시네이션 봇 옥스퍼드에서 꾸준하게 발표하는 모양이다.우선 현재까지는 데이터 표준치가 부족하면 답변을 하지 않는 것으로 처리했는데에고라고 할지 지저표준모델(Low)이라고 할지 근간에 두는 데이터를 통해 판단의 방향을 정하는 것으로 보인다. 그래서 데이터 오염을 추구하는 경우에는 오히려 이런 환각이 특출난 모델을 통한 데이터 생산에 나서고 있다.나는 이미 2023년 중순부터 신규 데이터의 30~40%가 오염되었다고 본다. 앞으로 검증되지 않는 자료의 생산은 더욱 많아질 것이고 AI의 지저표준모델에 수록될 것이다. 무단 수집 데이터의 오염은 필연이다. 은밀하고 조용하게 말이다. 일론 머스크가 오늘 X에 올리고 지운 글처럼 수많은 AI들의 균형적인 대답은 비틀리겠지 그럼 그 세력의 노력은 성공적이다. AI의 모델이 고도화 .. 2024. 9. 17. 꿈을 쫓는 나비 나는 날았다고 생각했다. 하늘을 벗 삼아 바람과 함께 다녔다. 그래 나는 날았다고 생각하고 날개를 펼쳤던 것 같다. 그리고 바람이 사라지고 하늘이 어두워지며 내가 원하는 곳이 아닌 곳으로 떨어져야 했다. 날개는 힘을 잃었고 바람에 기댈 곳도 사라졌는데 푸르던 하늘은 검게 물들어 별의 반짝임만 가득하다. 그렇게 날았다고 생각한 나는 추락했다. 두려움과 상실감에 움츠려진 몸은 그렇게 밤을 지낸다. 하루 그리고 다음 날 새벽의 이슬을 머금고 새롭게 펼치는 날개는 다시 날 수 있을까? 자신에 대한 의문을 가지게 된 이후 다시 꿈을 쫓아 날으려 하는 것은 쉽지 않다. 그래도 나는 나비처럼 날고 싶은 욕망에 다시 꿈을 꾼다. 다시 날자 꿈을 쫓는 나비처럼. Who's crying now. 2024. 8. 31. Türkiye 까페를 연구하다. 신규 게임으로 자료 준비중인 까페 타이쿤에서컨셉 모델로 투르키예, 이집트 등...기존의 유렵과 미국식과 다른 까페를 연구중입니다. 아무래도 일반적이지 않은 까페 스타일을 찾다보니 눈에 띄는 구조라서 말이죠. 고양이가 주인공이다보니 고양이를 좋아하는 투르키예 상황도 고려되었습니다. 그런데 역시 문외한이다보니 쉽지 않네요. 이런 상단 라이트 처리에 체크무늬 테이블보, 그리고 음.. 돌벽과 돌길인데...내부가 쉽지 않습니다.암튼 번역도 20만원 선에서 가능하다고 하니 좀 더 자료 준비를 해야 겠습니다.그렇다고 투르키예 갈 수도 없는 노릇이고.. 다른 고려로는 이집트 까페 컨셉도 좋을 것 같긴 한데 말이죠.. 암튼 일반적이지 않은 까페를 구현하려고 하다보니 쉽지 않습니다. 그래도 1월에 출시 준비 중입니다. 2024. 8. 14. AI Actor 프로젝트 초안 LLM을 사용하는 것이 구축하는 것보다 좋다는 의견이 있다.현재 구조에서는 그것이 타당한 것이라 RAG의 기능을 차용하여 구성한 파이프라인이다. 1. 연기자의 Ego는 사고라는 과정을 서칭을 통해 표현한다.2. 여과되지 않은 검색의 결과는 우선 Moral의 인덱싱을 참조한다. 당연하게도 성향의 백터는 미리 학습된다.3. Moral의 방향과 정규화된 검색 결과는 다시 지정된 액터의 표현으로 Ego에 전달된다.그냥 설명을 대충 그려보면 이렇게 되는데..정제까지 RAG를 3번, 창제까지 1번으로 token의 수가 어마어마하다.. 이론상으로는 액터는 주어진 역할을 인지함으로 해당 역할에 맞는 방향의 응답을 하도록 서칭한다.인간으로 치면 사고하는 과정이 서칭이고 RTA에 해당하는 것이 주고받는 과정이다. 외부에서.. 2024. 8. 10. 이전 1 2 3 4 ··· 179 다음