I.Coin Project36 AI 연산의 기준 확인 대부분의 데이터 셋이 먼저 수학적 접근을 하게 된다.이미지에서 보면 수학적 기준에 가중치가 몰리는 것을 알 수 있다. 데이터 셋 접근시 수학적 기준을 제시하면 해당 내용을 기준으로 판단하고 n차 기준을 제공하면 오염도 증가를 예상할 수 있다. AI개발자 입장에서는 어쩔 수 없는 선택이지만 유료 모델에서는 추론 과정에서 가중치 키워드 기준이 여러번 확인 되는 듯 하니 그냥 심심풀이로 봐주면 좋겠음. 추론 모델이 증가하면 결국 이전에 적었던 내용과 같이 가상의 예상 답변을 병렬로 준비하는 과정이 늘어날 것으로 보여진다. 결국 다 때려 넣고 맞추기 시작하는 데, 이것은 생각보다 좋은 방법이다. 제한된 결론 도출에도 도움이 되고.. 이번에 AI사업에 연관 될 것으로 예상되어 연구중..ㅎㅎㅎ 2025. 1. 24. AI 할루시네이션 봇 옥스퍼드에서 꾸준하게 발표하는 모양이다.우선 현재까지는 데이터 표준치가 부족하면 답변을 하지 않는 것으로 처리했는데에고라고 할지 지저표준모델(Low)이라고 할지 근간에 두는 데이터를 통해 판단의 방향을 정하는 것으로 보인다. 그래서 데이터 오염을 추구하는 경우에는 오히려 이런 환각이 특출난 모델을 통한 데이터 생산에 나서고 있다.나는 이미 2023년 중순부터 신규 데이터의 30~40%가 오염되었다고 본다. 앞으로 검증되지 않는 자료의 생산은 더욱 많아질 것이고 AI의 지저표준모델에 수록될 것이다. 무단 수집 데이터의 오염은 필연이다. 은밀하고 조용하게 말이다. 일론 머스크가 오늘 X에 올리고 지운 글처럼 수많은 AI들의 균형적인 대답은 비틀리겠지 그럼 그 세력의 노력은 성공적이다. AI의 모델이 고도화 .. 2024. 9. 17. AI Actor 프로젝트 초안 LLM을 사용하는 것이 구축하는 것보다 좋다는 의견이 있다.현재 구조에서는 그것이 타당한 것이라 RAG의 기능을 차용하여 구성한 파이프라인이다. 1. 연기자의 Ego는 사고라는 과정을 서칭을 통해 표현한다.2. 여과되지 않은 검색의 결과는 우선 Moral의 인덱싱을 참조한다. 당연하게도 성향의 백터는 미리 학습된다.3. Moral의 방향과 정규화된 검색 결과는 다시 지정된 액터의 표현으로 Ego에 전달된다.그냥 설명을 대충 그려보면 이렇게 되는데..정제까지 RAG를 3번, 창제까지 1번으로 token의 수가 어마어마하다.. 이론상으로는 액터는 주어진 역할을 인지함으로 해당 역할에 맞는 방향의 응답을 하도록 서칭한다.인간으로 치면 사고하는 과정이 서칭이고 RTA에 해당하는 것이 주고받는 과정이다. 외부에서.. 2024. 8. 10. 비트 종말 시나리오 비트 해시가 줄고 있습니다.반감기 이후 더 많은 시간과 전력이 필요해짐에 따라 일부 사업 변경도 이루어지고 있죠.결국 채굴이 줄어들며 지금보다 거래가 어려워짐에 따라 장부 시스템이 거래소 위주로 변경 될 것으로 예상됩니다.이 경우 투명성을 장점으로 가져가던 부분은 얼룩지게 되겠죠.마곡 때처럼 개인 지갑을 볼모로 말입니다.이 부분은 간과하던 부분인데 DTCC에서 ETF 보증을 제한하기로 한 오늘 다시 보면 의미가 있는 행동으로 생각됩니다.비트는 과연 거래소 위주로 개편될까요? 그럼 거래소는 비트의 복마전이 안된다는 보장이 있을까요? 네이티브 숏이 비트에도 적용 될 시가가 멀지 않은 것 같습니다. 2024. 4. 30. AI Renderer 구현 ai 드래그 및 제스쳐를 통한 형상 변환이 발표되었습니다. 영상을 보고 띵~ 내부적으로 구상하던 AI Renderer의 구현 가능성이 확인되더군요. 스크립트 구조의 목적 파일을 통해 렌더링 되는 게임화면 스크립트 -> 프롬프트 분리 -> 원본 -> 스크립트 액션 -> 원본에서 transform -> Screen Buffer 묘화~ 더이상 리소스의 한계는 없겠네요. 물론 그 시작은 GH AI Renderer가 함께하고 싶습니다. ㅎㅎㅎ 2023. 5. 23. 시계열DB와 생성형 AI의 미래 생성형 AI상용화를 위해서 필요한 것은 생성 로그일 것이다. 생성 로그를 위해 만들어지는 수많은 메타정보는 수천 수억개의 데이터 청크를 비교 검색, 합성해야 하는 AI입장에서는 큰 리소스 소모가 예상된다. 그런데 시계열DB를 통해 타임스탬프로 처리된 AI학습장(학습에 사용된 정보)를 활용하면 이런 문제도 해결된다. 단순하게 timestamp 인덱스를 통해 성공된 머지 정보를 기록만 해도 머지에 사용된 메타를 시간 값으로 얻어올 수 있다. 물론 단순하게 생각한 경우이고 이런 경우 학습에 조금 더 많은 준비가 필요하지만 미래를 위해서는 해야만 하는 선택이다. 이 때문에 시계열 DB의 미래는 AI와 함께 밝다고 볼 수 있는 것이다. 음... 2023. 5. 15. 이전 1 2 3 4 ··· 6 다음