제 나이 올해 60 입니다 ...    IT 분야 일 한지가 30 년 입니다 ...  최근에 미국이 국가안보 기술로 애기했던게 반도체 설계/제작 기술이고 또 하나가 인공지능 기술 입니다 ...  저는 최근 한 3 년 이상을  딥러닝 논문 이슈를 계속 공부해왔읍니다 ...  이렇게 한 3 년 딥러닝 논문 이슈를 공부하다 보니  딥러닝 비젼 설계쪽 기술도 살펴봤고 또 하나가 초거대 모델쪽 입니다 ...    최근 초거대 모델을 살피다 보니 비젼쪽 기술인 광학문자인식(OCR 기술) 노하우가 어떤식으로 가능하겠다가 눈에 보이더라구요 ...   광학문자인식쪽은 네이버도 오래전부터하는것 같더군요 ...   이제 본론으로 들어가자면  초거대 모델 기술의 기반기술이 구글 트랜스포머 딥러닝 모델 설계 기술이 그 근원 이거든요 ...  구글 트랜스포머 모델이 나온지 한 4 - 5 년 되는것 같구요 ...  초거대 모델의 근원이 되는 딥러닝 모델이 GPT-3 모델이고  이것의 기반이 트랜스포머 모델 이거든요 ...   얼마전 유튜브를 보다 보니 유튜브 사회자가 대기업 연구개발 중역한테  트랜스포머 모델 실력자가 한국에도 상당한데 그렇다면 초거대 모델 구현도 이런 사람들이 다 가능한것 아니냐 라고 질문을 하더군요 ...    제 생각은 이렇습니다 ...    초거대 모델이 됬건 뭐가 됬건 자기가 파악하고 있으면 별것아닌 쉬운게 되는거구  자기가 모르면 한없는 기술장벽을 느껴야 하는것 같읍니다 ...    제가 딥러닝 논문 이슈를 한 3 년 이상 꾸준히 분석했다고 했는데요 ...     제가 초거대 모델 분석이 가능한것도 이렇게 한 3 년 딥러닝 논문의 이슈를 여러가지를 세부분석한게 없었으면 아마도 초거대 모델 분석이 벽을 만나 아무것도 진행이 안됬을텐데  그래고 딥러닝 이슈 몇십가지를 그동안 파악에 성공하다 보니 이렇게 초거대 모델 분석도 진행이 가능한것 같읍니다 ...      구글 트랜스포머 모델 분석도 하다 보면 진짜 공부할께 계속 나오구요 ...  이런 부분들 그동안 3 년여 공부를 했던것 같읍니다 ...    처음엔 구글 트랜스포머 모델 공부를 뭘 어덯게 해야 하는지 감도 못 잡았는데  시행착오를 3 년간 수없이 겪다 보니 이제 앞이 보이는것 같읍니다 ...     그래도 3 년간 논문 이슈 분석을 위해 하루에 최소 3 시간 이상은 공부했던것 같읍니다 ...     저도 3 년을 시간투자해서 초거대 모델 설계 구조와 동작원리 분석이 되있으니 가능하다면 대기업쪽 초거대 모델 기술자문을 맡아보고 싶은데  어떻게 대기업쪽에서 판단하실지는 잘 모르겠읍니다 ....             

딥네트워크     장석원    010 3350 6509     sayhi7@daum.net

+ Recent posts