목록전체 글 (235)
딥 네트워크 - 딥러닝 모델 분석/네트웍 통신/카메라 3A 튜닝 분야
중장년 기술창업을 바라보는 한국의 분위기를 이야기해 보려 합니다 .... 제가 열흘만 있으면 59 살 입니다 ... 59 살까지 인생을 살다보니 내가 사업하면 분명 성공할것 같아서 약간 준비가 부족한 상태에서 사업을 하다가 결과물이 2 % 부족해서 큰 손해를 봤읍니다 ... 40 대 중반에 신중치 못한 준비상태로 사업을 했다가 큰 손해를 입으니 지금까지도 그때의 큰 손실을 복구를 못하고 있읍니다 ... 저의 경우 요즘 한 3 년간 딥러닝 음성인식 분야 / 가상인간 구현분야 / 초거대 언어모델 분야 / 방송이나 화상회의 등을 염두에 둔 대용량 미디어 서비스 구현 등등 세부 설계 구현 노하우 파악에 구글링을 하루에 서 너 시간씩 했었구요 ... 처음에 준비할때에는 깊이있게 파악한 상태가 아니니 구글링을 해도..
WebRTC 오픈소스 미디어 서버 Janus Gateway 의 설계를 유럽 이탈리아 Meetecho 에서 설계했읍니다 ... Meetecho 의 Janus 서버 소스가 어떤 구조로 동작하고 어떤 설계구조로 설계했는지 파악하는데 약 10 달이 걸렸읍니다 ... Meetecho 의 Janus 서버 소스가 리눅스 개발환경에서 동작하는 오픈소스 구조의 소스 이기에 이 오픈소스를 설계한 사람들은 어떤식으로 소스의 설계를 했는지 파악하는것에 시간이 걸렸읍니다 ... Meetecho 의 Janus 서버 소스는 약 6 명이 화상회의 구현에 필요한 기본기능의 소스를 설계해서 제공하고 있구요 이 소스를 기업이 상용 서비스를 가능하도록 커스토마이징하려면 구체적으로 이 소스의 각 설계부분들이 어떤 구조로 설계되 있는지 Mee..
딥러닝 국내외 논문분석을 본격적으로 한지가 거의 2 년 입니다 ... 처음에 딥러닝 기술이슈 분야로 정한 분야가 음성인식 분야여서 음성인식 으로 논문을 분석하다 보니 Kaldi 라는 Tool 이 중요한 역할을 담당했다는것을 알았고 큰기업에서도 Kaldi Tool 로 음성인식 성능개선 작업에 많은 진전이 있었읍니다. 해외논문들을 음성인식으로 살펴봐도 속시원하게 자기 논문의 기술적인 설계 구조를 설명한 논문은 찾는게 쉽지 않더군요 ... 글로벌 대기업의 음성인식 논문이건 유명 대학 논문이건 자기 논문의 딥러닝 설계 구조를 친절하게 설명하는 논문은 찾기가 어려웠읍니다 ... Kaldi 라는 Tool 로 음성인식 학습시 Alignment 하는 작업을 처리하는것에 도움이 됬다는것을 이해(파악)한것만으로는 만족스럽..
RabbitMQ 클라우드 서비스를 적용한 수만명 정도의 대상으로 실시간으로 대규모 미디어 데이터 송수신 기술개발 및 기술자문 가능 합니다 ... RabbitMQ 클라우드 서비스의 API 함수를 적용해서 어떻게 1 : N (수만명)의 송수신이 실시간에 가깝게 가능하게 구현 설계가 가능한지 파악에 성공했읍니다 ... 이것을 분석하는것을 일년반전에 시작한 동기가 이탈리아 개발 회사 Meetecho 가 설계한 오픈소스인 Janus Gateway 오픈소스를 거의 일년 이상 소스를 세부적으로 검토분석하다가 Janus Gateway 오픈소스가 RabbitMQ 서비스로 미디어데이터를 송수신하는 기능을 이 오픈소스에 포함된것을 파악하면서 본격적으로 1 : N (수만명)의 미디어 데이터의 네트웍 통신 송수신이 실시간에 가..
제가 올해 59 세 입니다 ... 저도 30 여년전 대학원 전자공학과도 졸업도 했고, 24 년전 IMF 때 구조조정됬던 대기업 연구소 7 년 재직 경험도 있읍니다 ... 오늘 하고픈 이야기는 기술지향적인 스타트업의 기술적 능력 및 사업적 능력은 과연 어떤 기준으로 평가해야 하는가를 이야기해 보고자 합니다 ... 요즘 스타트업의 능력 평가의 지표는 관련 석박사 내지 대기업 경력자들로 구성된 젊은 인력으로 구성된 팀이 일순위 인것 같읍니다 ... 젊은 인력으로 구성된 팀이 능력이 있다고 해도 저같이 60 이 코 앞인 시니어들도 능력이 되는 사람도 꽤 있거든요 ... 젊은 사람들은 순발력도 있고 머리도 빠릿빠릿 하게 돈다는것 저도 인정 합니다 ... 하지만 시니어는 젊은 사람들은 부족한 경륜 이라는것이 있거든..
오늘은 의류를 카메라로 촬영한 사람 영상위에 가상피팅을 구현하는 사업 안의 세부 설계 기술에 대해 이야기 해보려 합니다 ... 이를 구현하기 위해 제가 생각하는 딥러닝 설계 안에 대해 이야기해 보겠읍니다 ... 이를 구현하려면 Bounding Box 처리를 카메라로 찍은 영상에 입력해서 어노테이션 작업 즉 어떤 옷을 입은 것인지에 대한 정보를 학습데이터에 입력해주는 작업이 필요하구요 이런 이유로 대규모의 학습데이터의 준비 즉 어노테이션 작업이 대규모로 필요할것 같읍니다 ... 서양인 동양인이 옷을 입은 영상을 즉 학습데이터의 준비가 대규모로 필요할것 같읍니다 ... 옷의 종류도 굉장히 여러가지 이고 옷을 입은 영상도 여러 각도로 촬영한 영상이 대규모로 있어야 어노테이션 정보로 학습한 정확도가 올라가니까요..
저의 경우 올해 59 세 입니다 ... 저도 30 여년전 대학원 전자공학과를 졸업하고 대기업 연구소에서 7 년 근무하다가 IMF 때문에 구조조정으로 회사를 나오게됬읍니다 ... 결론부터 말씀드리고 이야기를 해 보도록 하겠읍니다 ... 기술 스타트업 창업시 기술을 확보하고 이윤확보를 하려면 피튀기게 빡시게 준비를 해야 합니다 ... 아무리 피튀기게 빡시게 준비를 한다 해도 내가 세운 스타트업이 성공으로 가는것을 단번에 성공시키는것은 쉽지 않읍니다 ... 기술 스타트업을 설립하는 대표라면 대표 자신이 채용해서 뽑을 개발 경력자보다 제품개발시 겪는 문제가 어떤게 있을지 또 이런 문제는 어떻게 해결해야 좋을지 이런것들의 확실한 준비가 필요한데 ... 제품개발시 문제가 어떤게 있을지 또 이런 문제는 어떻게 해결해..
저의 경우 제 소개를 드리자면 1989 년에 일반대학원 전자공학과를 졸업했구요 그후 91 년부터 7 년간 대기업 중앙 연구소 시스템제어실에서 연구직으로 근무 경험이 있읍니다 ... 코스닥 상장사가 된 기업의 기반기술팀에서 계약직으로 약 1 년 근무도 했었구요 최근에 중소기업에 기술고문으로 약 1 년반 근무를 했었읍니다 ... 저는 IT 분야 SW / Firmware 개발용역 관련 일을 거의 30 년 하다보니 여러 분야의 개발용역이 어떤 방식으로 처리되는지 이해하고 있읍니다 ... Camera / WIFI / LTE / USB Host / USB Client / 블루투스 / TFT-LCD / Touchscreen / FAT32 / SD Card / Flash Memory SDRAM 등의 분야의 일을 처리해..
자동차 라이다 시스템 세부설계 분석한지 거의 1 년 다 되 갑니다 .... 라이다 설계 구조를 간략히 설명드리면 ... 라이다 설계시 전후방의 자동차 오브젝트를 3 차원 이미지 데이터를 얻기 위해서 ... 전후방에 자동차를 향해 VICSEL 레이져로 빔을 쏠때 자동차를 3 차원이미지 데이터를 얻을수 있도록 광학렌즈부를 설계해야 하는데 ... 이렇게 빔을 쏠때 검토할것은 전후방에 어느 위치에 자동차가 있을지를 모르기에 광학렌즈부 설계라는것이 정확히 얼마의 거리로 타겟으로 빔을 쏘는것으로 설계를 해야 하는지를 결정하기가 어려운것으로 저는 이해 하거든요 왜냐하면 정확히 얼마 거리를 타겟으로 빔을 쏠지가 정해지지 않으면 자동차 라이다 수신부인 SPAD 이미지센서부에서 광전자 에니지를 픽셀 단위로 라이다 수신부에..
로라통신 관련 이슈에 대해 업체로부터 문의를 받은것이 약 3 년전쯤 입니다 ... 로라통신은 로라통신 디바이스단 설계 기술 + 로라통신 게이트웨이단 설계 기술 + 로라통신 네트웍 서버 설계 기술 이렇게 이루어져 있읍니다 ... 로라통신은 클래스 A 통신 처리 방법과 절차가 로라 귝제 규겨문서에 규정되 있고 SEMTECH 사에서 이 국제 규격을 기준으로 해서 SOC 반도체 설계 상용화를 했읍니다 ... 로라 국제 규격문서에는 CLASS A 통신 규격만 규정되 있는게 아니고 보안인증처리를 CLASS A 통신 처리를 하면서 어떻게 설계할것인가가 규격문서에 규정되 있읍니다 ... 처음에 분석을 시작할때에는 CLASS A 통신 절차와 방법 이해하는것도 쉽지 않았읍니다 ... 로라통신을 약 3 년간 틈틈이 시간을 ..
DB하이텍, 이미지센서 사업 확대…글로벌셔터∙SPAD 공정 개발 - 전자부품 전문 미디어 디일렉 www.thelec.kr/news/articleView.html?idxno=11953 DB하이텍, 이미지센서 사업 확대…글로벌셔터∙SPAD 공정 개발 - 전자부품 전문 미디어 디일렉 DB하이텍이 이미지센서 사업 확대에 나선다. DB하이텍은 110나노미터 플랫폼을 기반으로 한 글로벌셔터와 SPAD(single-photon avalanche diode) 공정을 개발 완료했다고 16일 밝혔다. 신규 이미지센서 사업 www.thelec.kr 자동차 라이다 의 광파장 수신부 설계의 핵심인 SPAD 공정기술을 개발했다는 기사 입니다 제가 라이다에서 제일 관심이 컸던 분야가 광학렌즈부 설계쪽과 광파장 수신부인 SPAD 공..
저의 경우, 한 2 년전부터 딥러닝 음성인식 논문분석을 진행했읍니다 ... 지도학습부터 자기지도 학습까지 살펴봤읍니다 ... 지도학습이나 자기지도 학습이나 학습데이터셋의 데이터 갯수가 일정 이상으로 충분치 않으면 상용 수준으로 만족스런 성능이 가능하다는 논문은 제가 찾지 못한것 같읍니다 ... 대기업들의 음성인식도 예전 논문의 기법의 파악없이는 성능내기가 어려운 구조더군요 ... Kaldi 라는 툴의 도움으로 음성인식 딥러닝 모델을 학습시키거든요 ,,, 이게 보통의 딥러닝 모델의 구조이구요 ... Kaldi 툴도 HMM-GMM 딥러닝 모델로 구현된것인데 ... 죤스홉킨스 대학에서 오래전에 발표한 기술인데 아직도 이것의 도움이 필요 하거든요 ... 저는 그래서 최근까지 음성인식의 롤 모델인 구조가 CTC-..
스마트 팜 사업화에 대해 그동안 준비한것들을 이야기해 보겠읍니다 ... 스마트 팜을 구현하려면 농장내에서 농작물 제어장치들이 거의 500 - 1000 미터 혹은 그 이상의 거리에서의 통신되는것이 필요한데 그중에 가장 적절하다고 판단되는 통신방식이 장거리 저전력 통신 프로토콜인 로라통신 이라서 제가 그동안 각고의 노력 끝에 터득한 내용을 소개드려 봅니다 ... 로라통신 관련 이슈에 대해 업체로부터 문의를 받은것이 약 3 년전쯤 입니다 ... 로라통신은 로라통신 디바이스단 설계 기술 + 로라통신 게이트웨이단 설계 기술 + 로라통신 네트웍 서버 설계 기술 이렇게 이루어져 있읍니다 ... 로라통신은 클래스 A 통신 처리 방법과 절차가 로라 귝제 규겨문서에 규정되 있고 SEMTECH 사에서 이 국제 규격을 기준으..
장거리 저전력 무선통신 프로토콜인 LoRa 통신 개발용역 및 기술자문 - Class A 통신 처리 노하우 확보 - Class A 통신시 보안인증 처리 노하우 확보 현재 LoRa 통신 Class A 통신 처리 및 Class A 통신시 보안인증 처리 프로토타입 개발용역 및 기술자문 가능 장거리 저전력 무선통신 프로토콜인 LoRa 통신 양산 대응용 안정화 개발시 추가적인 기간과 비용 필요 스마트 팜 사업화에 대해 그동안 준비한것들을 이야기해 보겠읍니다 ... 스마트 팜을 구현하려면 농장내에서 농작물 제어장치들이 거의 500 - 1000 미터 혹은 그 이상의 거리에서의 통신되는것이 필요한데 그중에 가장 적절하다고 판단되는 통신방식이 장거리 저전력 통신 프로토콜인 로라통신 이라서 제가 그동안 각고의 노력 끝에 터..
스마트팜 사업화 준비도 그동안 한 2 년간 딥러닝 음성인식 과 3D 엔진 설계 관련 논문을 400 편 이상 살피다 보니 음성인식 과 3D 엔진 관련 딥러닝 모델 분석이 상당히 됬는데 문제는 비즈니스 모델 제시더라구요 지금 쓰는 글도 연구 결과물을 내는것이 당장 돈이 안되니 투자사에서는 제가 연구 결과를 내는게 가능하다고 해도 당장 돈이 되는 비즈니스 모델 제시가 부족하면 아마도 투자를 꺼릴것 같읍니다 ... 스마트 팜 사업화 분야도 요즘 석유 혹은 식량등의 자원을 가진 나라들이 각종 자원을 무기화하고 있고 그에 따라 공급망 위기까지 이어지고 있읍니다 ... 스마트팜 사업화 검토시에도 가장 큰 문제가 돈이 되는 사업화(비즈니스 모델) 모델을 제시하려면 돈이 안되는 연구개발에 상당한 기간과 돈이 필요하다는 ..
DMBTEC 장석원 입니다 NeRF 논문을 본격적으로 분석한지 10 달 됬읍니다 NeRF 논문은 2D IMAGE TO 3D SCENE 을 구현하기위해 다른곳에서 발표한 논문을 꽤 여러편 참조하는것 같읍니다 대기업 에서도 NeRF 논문으로 사업화를 진행중인데 이 NeRF 논문이 그리 호락호락하게 분석되게 논문에서 이슈 파악에 대해 자세한 언급이 부족해서 NeRF 논문을 제가 세부적으로 파악 성공했다고 대기업 제안부서에 보냈었는데 저를 믿지 못하는것 같더라구요 NeRF 논문 설계구조 파악이 호락호락하지 않은것을 대기업 관계자도 자기네도 파악하려 노력해도 쉽사리 파악이 어려우니 어찌보면 당연한 반응 같읍니다 오늘 새벽에 NeRF 논문 설계 이슈중 논문에 자세히 언급 안된 부분의 구현 메커니즘 파악이 필수라서 ..
올 한해 딥러닝으로 투자받으려고 시도도 해봤구요 요즘 미디어 데이터를 수만명 수십만명한테 방송 서비스를 하려면 수신을 원한다고 체크한 가입자만 방송 서비스를 수신 가능하게 미디어 송수신 설계를 해야 합니다 이런 대용량방송 서비스 구현시에는 필수적으로 로드밸런싱 제어가 필수적인데 이런 노하우도 파악하고 있읍니다... 대용량 미디어 데이터 실시간 송수신 서비스 구현 개발을 클라우드 서비스인 RabbitMQ 를 적용해서 설계시 메시지큐 통신이 어떤 구조로 처리가 되는지 RabbitMQ 를 어떻게 적용해서 구현되는지를 이해하고 있고, 즉 RabbitMQ 로 통신 부하 분산처리 설계를 구현시 L4 스위칭 장비를 적용해서 어떻게 로드밸런싱 제어 기법을 적용하는것도 파악하고 있읍니다 클라우드 서비스 RabbitMQ ..
아래의 내용은 페이스북에 올라온 3D Structured Light 기술을 이용한 얼굴인식 도어락을 중국 샤오미에서 개발했다는 기사 입니다 ... 다른것은 아래의 내용에서 궁금한게 없는데 ... 3D Structured Light 를 어떻게 송출제어를 해서 31000 개의 위치로 빔을 발사할수 있었는지 이것의 해결이 중요한 기술 이슈 인것 같읍니다 ... 이 3D Structured Light 기술로 자동차 라이다 설계시에도 응용설계 적용이 가능할것 같다 ...
안녕하세요 DMBTEC 장석원 입니다 저의 경우 딥러닝 해외논문을 살펴본지 2년이 넘읍니다 초기에는 음성인식쪽을 살펴봤구요 음성인식도 최신 구현 기법이 아닌 Legacy 구현 기법으로 구현하는것은 나름 파악이 됬는데 Legacy 음향모델도 깊숙히 분석했구요 ... 언어모델 을 GPT-3 구현 기법으로 처리하자니 초거대 GPU 환경 이 필요하고 이 GPT-3 언어모델의 개략적인 트랜스포머 모델 설계구조는 이해했는데 저는 상용으로 접근한 경험이 없는데 이쪽 경함이 딸려서 이쪽 논문분석은 잠시중단했구요 요즘 한 10 달정도를 엔비디아의 NeRF 논문의 세부 구현을 어떻게 동작시키는지를 한 10 달분석했읍니다 이쪽은 대기업에서도 관심이 많은 이슈라 저도 10 달을 시간투자를 했읍니다 NeRF 논문도 2D 이미지..
WebRTC JANUS 미디어 서버의 경우 대용량 미디어 서비스를 위해 클라우드 서비스 RabbitMQ 로 기본 동작 구현까지 참조소스를 제공하고 있읍니다 저는 RabbitMQ 클라우드 서비스를 쿠버네이트로 대용량 네트웍 서비스 구현 설계 안을 분석하고 있읍니다 Pod 간 통신 그리고 Pod 와 서비스와 통신 구현 방안도 하나씩 파악하고 있읍니다 Kubernate 툴로 이런것들 제어 하나씩 세부 검토하고 있읍니다 투자사에 투자제안서 작성중 입니다 DMBTEC 장석원 Home : https://dmbtec.blogspot.com/ HP : 010-3350-6509
한 일주일전에 WebRTC 미디어서버로 공연 방송 송수신 기술자문이 가능한지 문의메일을 받았읍니다 다들 접ㆍ다 더 잘 아시겠지만 고액 인건비 지출이 필요한 능력자분을 모시는게 우선 이거든요 이건 대기업도 마찬가지 입니다 기본적으로 이런것의 개발은 기본적으로 프로토타입 개발을 능력자를 모셔서 진행해야 하고 상용화를 위한 양산대응 개발도 출중한 능력자분이 필요합니다 저 같은 경우만해도 클라우드 서비스로 개발하기위한 세부설계 안을 준비해놨는데 이 설계안도 확장성 있게 구현하기 위해서는 제가 준비한 기본적인 세부 설계 안 만으로는 완벽한 대응이 어렵습니다 확장성 있게 대응을 하려면 바로 위에서 언급한 이쪽으로 분석과 구현 경험이 반드시 필요할수 밖에 없읍니다 이렇게 처리하려면 모든게 다 비용지출이 상당히 필요하..
인터넷상의 여러 활동을 하면서 느낀 점 몇자 적어봅니다 요즘 세상의 변화가 굉장하다 라는것을 체감 못하시는분들도 많은것 같읍니다 기술적인 노하우 관련 부분만 하더라도 예전에는 국내 최우수 교수님팀이나 대기업 관련 연구소 정도가 세부 노하우 정보의 접근이 가능한 시대가 있었는데 요즘 세상은 인터넷 이나 유투브상에 기술 노하우 정보 관련 내용의 검색이 시행착오를 겪으면 기술 노하우 파악이 어느정도 가능한 시대에 살고 있읍니다 돈 이 되는 세부 노하우 정보를 얻으려면 그 만큼 시간투자를 하는 노력 없이는 돈이 되는 정보 획득은 불가능합니다 딥러닝 노하우도 요즘에는 시간을 투자해서 꾸준히 노력을 하면 돈이 되는 정보획득도 가능하다고 저는 판단하거든요 시대가 이렇게 변하다 보니 소기업은 돈벌이하기가 예전보다 몇배..
DMBTEC 장석원 입니다 ... 저는 최근에 논문을 거의 300 편 가까이 검토분석하면서 3D 모델링 관련해서 3D 캐릭터를 생성해서 이 3D 캐릭터로 애니메이션을 만들려면 그동안 10 년 이상의 세월동안 국내 대기업 게임회사들은 어떤 방식으로 사업화를 접근했을까 부터 궁금해졌읍니다 ... 저는 맨처음에는 딥러닝으로 3D Reconstructing 쪽 논문에 관심을 갖고 살펴봤구요 ... 이쪽을 세부적으로 분석하다 보니 엔비디아의 3D Graphic 엔진 설계 구조 같은것의 분석 필요를 느꼈읍니다 ... 삼성전자 무선사업부 연구소에서는 이미 10 여년전 엔비디아의 3D Graphic 엔진을 적용해서 3D 어플리케이션을 설계하는 작업들이 이미 진행되고 있었는데 그동안 저는 관심을 안 가져서 몰랐었구요 ...
다음은 StyleGAN 2 Pytorch Official Github 사이트의 내용 입니다 ... StyleGAN 2 Pytorch Official Github 사이트의 내용중 개발환경 기본구조를 설명한 내용 입니다 ... 아래에 표기된 엔비디아 DGX-1 딥러닝 서버의 구매 가격이 약 15 만불 정도 입니다 ... StyleGAN 2 Pytorch Official Github 사이트의 내용중 개발환경 기본구조를 설명한 내용에 걸맞은 아마죤 클라우드 GPU 서비스 입니다 ... 위의 딥러닝 개발환경 구축 내용을 토대로 위의 아마죤 GPU 클라우드를 임대할 계획입니다 ... 아직 자금준비도 안되있고 해서 클라우드 개발환경 구축 비용과 개발비용(인건비)이 확보되면 아래와 같이 시작해보려 합니다 ... 적은규..
ToF 3D Image Sensor 의 동작원리가 자동차 라이다 센서에도 응용이 되고 3D Depth Image Sensor 에도 적용되는 기술 입니다 ... 3D Depth Image Sensor를 사용해서 3D Depth 이미지를 얻는 동작원리가 궁금해졌읍니다 ... 유럽의 Infinion 사와 일본의 Sony 사등이 3D Depth Image Sensor 설계 원천 기술을 가진 이스라엘 스타트업에 투자해서 원천기술을 확보한것 같읍니다 ... ToF 의 동작원리는 파장을 송출하면 송출한 파장이 멀리 떨어진 오브젝트에 부딪쳐서 반사되서 오는 파장이 도착하기까지 걸린 시간을 측정해서 오브젝트와의 거리를 측정하는것으로 저는 파악합니다 ... 그런데 동작원리는 이해를 했는데요 ... 3D Depth Imag..
우선 제 소개를 하면 저는 현재 58 세 이고 89년에 대학원 전자공학과를 졸업했고, 98년까지 약 7 년간 대기업 연구소에서 시스템 SW 개발 일을 했었구요 ... 저는 엔지니어 경력 30 년 입니다 ... 제가 30 년을 엔지니어로 경험하면서 느끼는것은 IT 분야 개발 일꺼리라는것이 한 2 년만 지나도 새로운 기술 나온것을 추가로 시간을 내서 반드시 공부가 필요하다는것 입니다 ... 원래 IT 분야에서 엔지니어쪽으로 일을 하려면 쉼 없이 새로운 분야 공부를 게을리 하면 기술 트렌드를 따라잡기가 어렵다는 점 입니다 ... 이 정도로 세부 파악해 놓았으니 밥벌이 한 5 년은 되겠지가 통하지 않는 분야가 이 분야 인것 같읍니다 ... 고객사 요구사항에 따라 그때 그때마다 다른 고객사 요구에 따른 IT 제품..
그동안 저는 StyleGAN 기술 분야도 세세히 살펴 봤읍니다 ... 엔비디아에서 개발한 StyleGAN 세부 기술 분석을 했었읍니다 ... 요즘 제가 관심을 가지는 분야중 하나가 2D 이미지를 3D 모델 로 맵핑시키는 이런 딥러닝 모델에 관심이 많읍니다 ... 2D 이미지를 3D 모델 로 맵핑시키는 이런 딥러닝 모델을 세심히 국내외 논문을 살펴봤는데 ... Shape Embedding 기술로 3D Shapes 표현을 어떻게 Reconstruction 할지 ... 3D Texture 의 질감을 살려서 딥러닝 모델을 구현하려면 딥러닝 모델의 설계 구조가 어떻게 설계되고 있는가 ... 뭐 이런것들을 관심을 가지고 분석중 입니다 ... 이렇게 2D 이미지를 3D 모델 로 맵핑시키는 이런 딥러닝 모델을 분석하다..
딥러닝 분야는 대기업에서 경력이 있거나 아니면 딥러닝 석박사가 아니면 참 이쪽한다라고 애기하는게 부담이 간다 ... 그동안 2 년여 기간동안 딥러닝 공부를 마음먹고 공부하고자 했던 분야가 음성인식 분야였었고 이것을 공부하면서 StyleGAN 분야 공부도 같이 했었다. 음성인식 분야는 처음에는 음향모델쪽 공부를 주로하는데 시간을 보냈다 ... Mel-Spectrogram 설계 구조라든가 ... Cepstrum 설계 구조 ... Fundamental Frequency F0 ... 뭐 이런것들 공부를 했다 ... 이런것들 공부하면서 죤스홉킨스 대학에서 오래전 개발했던 딥러닝 모델인 HMM-GMM 모델 구조인 Kaldi Tool 쪽도 살펴보지 않을수 없었다 ... 죤스홉킨스 대학에서 오래전 개발했던 딥러닝 모델..
저는 요즘 한 2 년 넘게 딥러닝 음성인식 논문을 한 150 편 세부분석하고 있읍니다 ... IT 제품 개발 일감 처리 관련해서 제가 요근래 어떤 어려움이 있었는지를 적어보겠읍니다 ... IT 제품 개발(HW 개발 및 펌웨어 개발 모두)을 의뢰가 있으면 검토하고 처리가 필요한 부분을 정리해서 설명드려 보겠읍니다 ... HW 개발 같은 경우도, 개발의뢰안이 들어오면 중요 부품(CPU, Memory, 각종 컨트롤러 칩셋 등등)의 납기를 확인해야 하고 보통 중요 부품의 경우, 몇개씩은 구매가 어렵고, 최소 1 K 이상의 재고 부담(보통 수천에서 억대 입니다)을 떠 안으면서 구매의 필요성이 생깁니다 ... HW 개발의 경우, 1 차 개발로 보드가 동작하는 경우는 매우 드물기 때문에 보통 2 차 혹은 3 차 수정..
그동안 한 6 개월 동안딥러닝 관련해서도 세가지 안 건 관련 메일 굉장히 여러 통을 투자사 관계자에게 송부드렸읍니다 .... 하나는 음성인식 이고 하나는 2 D 이미지를 3 D 모델로 변환하는 엔비디아 라이브러리 관련이고 ... 또 하나는 자율주행차 여러대의 카메라의 오브젝트 검출 및 인식쪽 이렇게 세가지 메일을 송부드렸읍니다 ... 저도 나이가 58 세이니 투자사에서는 당연히 검증된 결과물을 요구하시는것이 당연하다고 판단하고 있었는데 ... 제가 10 여년전에 비디오코덱 설계기술인 H.264 Video Decoder SW IP 설계를 사업화 한다고 ... 2 % 결과물 성과 검증에 실패해서 결국 30 평대 아파트 한채를 날렸읍니다 ... 이렇게 아파트 한채를 날리고 나니 그동안 비디오 코덱 설계 분석만..