티스토리

GPT-3 LLM 세부 알고리즘 분석 일인 AI 스타트업 딥네트워크

검색하기

[일인 AI 스타트업 딥네트워크 소개] 중국의 딥시크를 세부 분석하면서 느낀 점은 중국 천재들은 미국 방식을 완벽히 공부후 자기만의 독창적인 설계 구조로 DeepSeek 를 설계 하고 동작시켰다는것에 놀랬구요 ...

Kernel Porting/Linux

[일인 AI 스타트업 딥네트워크 소개] 중국의 딥시크를 세부 분석하면서 느낀 점은 중국 천재들은 미국 방식을 완벽히 공부후 자기만의 독창적인 설계 구조로 DeepSeek 를 설계 하고 동작시켰다는것에 놀랬구요 ...

파란새 2025. 2. 7. 05:01

안녕하세요 ? 제 여기 블로그에 DeepSeek LLM 글을 올렸었는데요 ... 다시 제 소개를 드리자면 저는 올해 61세 이고 IT 개발분야 30 년차 입니다 ... 저는 일인 AI 스타트업 딥네트워크 의 CEO 겸 CTO 입니다 ... 그럼 바로 본론으로 들어 가겠읍니다 ... 중국 DeepSeek 애기를 하려 합니다 ... 저도 전자공학과 석사로 IT 분야 30 년 경력 이라고 말씀드렸구요 ... 세상에 남들이 한번도 시도하지 않은 새로운 결과를 내려면 가정 중요한게 그동안 수십년간 남들은 어떤 방식으로 뭘 어떻게 처리했나를 파악하는것 없이 어떻게 세상 최초의 결과물 제시가 불가능하다고 생각하는 이유는 저는 IT 분야 30 년 경력으로 수천번 시행착오를 겪으면서 그동안 IT SW 개발 처리 방식이 어떤식으로 어떤 점이 개선되는 방식으로 개선되고 발전했는지 공부하는 과정 이었다고 저는 느낍니다 ... 중국 DeepSeek 도 마찬가지 입니다 ... 중국 DeepSeek 도 미국의 ChatGPT 같은 큰 스승이 LLM 은 이렇게 성능 내는거다 하는것을 그동안 수억명이 ChatGPT 를 사용하면서 중국의 베이징대 칭화대 개발 천재들도 미국의 ChatGPT 에서 수십 수백 가지를 배우지 못했다면 DeepSeek 는 세상에 나올수 없었다고 저는 생각 합니다 ... 제가 가장 놀라운것은 ChatGPT 는 내부 구조가 비밀이라 DeepSeek 와 같은 처리 방식인지도 모르지만 저도 LLM 을 거의 4 년 이상 공부하면서 미국의 Transformer Model 의 처리 방식 혹은 GPT-3 의 처리 방식이어야만 LLM 이 구현이 가능한줄 알았거든요 ... 그런데 중국의 딥시크는 저도 LLM 관련 모든 정보를 제가 그때 그때 다 살펴 보지는 않기에 미국의 글로벌 빅테크의 LLM 처리 구조 및 방식이어야 한다는 고정관념이 있었던 것 같았는데 중국의 딥시크를 세부 분석하면서 느낀 점은 중국 천재들은 미국 방식을 완벽히 공부후 자기만의 독창적인 설계 구조로 DeepSeek 를 설계 하고 동작시켰다는것에 놀랬구요 ... 중국 DeepSeek 방식을 그대로 NPU AI 칩 설계에 적용하면 미국의 개념의 방식을 적용했을때 보다 NPU 칩의 추론 성능도 훨씬 개선될수 있다는것도 파악했지만 저야 일인 AI 스타트업이니 중국의 독창적인 설계 방식을 분석해서 이런식으로 처리하는구나를 현재 이해 하고 있읍니다 ... 중국 천재들의 독창적인 설계 구조 및 방식을 파악하면서 LLM 은 꼭 미국 방식이 아니더라도 이렇게 중국 천재들의 방식으로도 가능하구나를 이해할수 있어서 저도 한 단계 스킬 업 할수 있었읍니다 ... 저야 요 전 블로그에도 적었지만 40 대 중반쯤 사업 말아 먹어 거의 알거지 상태라 저도 LLM 을 구현하려면 수천가지 기술 이슈 해결 방법을 파악해야 하는데 그래도 저도 최소 몇백개의 세부 이슈의 해결방법을 파악해서 잘 이해하고 있으니 LLM 같은 몇 조 내지 몇 십조가 드는 큰 사업에 저도 아주 바보는 아니니 그 사업의 몇백분의 일 규모의 LLM 작은 기술 이슈 해결 건 같은 작은 규모의 LLM 관련 세부 기술 이슈의 해결방안을 같이 고민할수 있는 저같은 일인 AI 스타트업에게도 기회를 주시면 대단히 감사할것 같읍니다 ...

일인 AI 스타트업 딥네트워크 CEO 겸 CTO 장석원 / sayhi7@daum.net / 010 3350 6509

저작자표시 비영리 동일조건