딥 네트워크 - 딥러닝 모델 분석/네트웍 통신/카메라 3A 튜닝 분야

음성인식 딥러닝 논문분석에 일년 넘게 분석으로 음향모델과 언어모델 확실하게 기술컨설팅이 가능 합니다 ..... 본문

Kernel Porting/Linux

음성인식 딥러닝 논문분석에 일년 넘게 분석으로 음향모델과 언어모델 확실하게 기술컨설팅이 가능 합니다 .....

파란새 2023. 1. 10. 08:07

딥러닝 국내외 논문분석을 본격적으로 한지가 거의 2 년 입니다 ...  처음에 딥러닝 기술이슈 분야로 정한 분야가 음성인식 분야여서 음성인식 으로 논문을 분석하다 보니 Kaldi 라는 Tool 이 중요한 역할을 담당했다는것을 알았고 큰기업에서도 Kaldi Tool 로 음성인식 성능개선 작업에 많은 진전이 있었읍니다.  해외논문들을 음성인식으로 살펴봐도 속시원하게 자기 논문의 기술적인 설계 구조를 설명한 논문은 찾는게 쉽지 않더군요 ...  글로벌 대기업의 음성인식 논문이건 유명 대학 논문이건 자기 논문의 딥러닝 설계 구조를 친절하게 설명하는 논문은 찾기가 어려웠읍니다 ...  Kaldi 라는 Tool 로 음성인식 학습시 Alignment 하는 작업을 처리하는것에 도움이 됬다는것을 이해(파악)한것만으로는 만족스럽지 않더군요 ...   Kaldi 라는 툴의 딥러닝 모델의 알고리즘을 파악하려고 노력했고, 딥러닝 논문분석 이라는게 한가지 분야만 공부한다고 되는게 아니더라구요 ...  저도 그동안 딥러닝의 기술 이슈 한 스무가지 이상을 공부한것 같읍니다 ...  딥러닝으로 저같이 50 대 후반의 나이에 밥벌이가 힘든게 석박사 과정 5 년을 공부하기에는 시간도 부담이 되고 또 학비도 부담이 되 더군요 ...   당장 가족의 생계를 책임져야 하는데 한가롭게 대학원 과정을 공부하기에는 많이 부담스럽구요 ...   저는 제 나이에 딥러닝으로 밥벌이가 쉽지 않아서 제가 또 그동안 한 일년반 정도 시간을 투자했던 분야인 대용량 방송 서비스를 위한 수십만의 사람이 구독 신청을 하면 구독 신청을 한 사람에게 방송을 송출하는 미디어 데이터의 송수신 기술을 파악에 성공했기에 이것으로 밥벌이를 하려고 하거든요 ...   참 한국은 밥벌이하려면 치열하게 준비해야 하는 나라인것 같읍니다 ...   그리고 딥러닝 분야는 결과물을 작은것이라도 준비하라는 분들도 많은데 ...  딥러닝 결과물 작은것은 보통 젊은 사람들이 AI 분야로 취업준비시 많이 준비를 하는것으로 알고 있읍니다 ...  딥러닝 사업 준비하다가 느낀것인데 딥러닝 사업화를 하려면 작은 결과물 정도로는 택도 없고 딥러닝 개발시 발생하는 이슈에 대해 어떤 문제가 발생하고 있고 또 어떤 방법으로 해결이 가능한지 뭐 이런것에 대한 준비가 필요한데 ...  보통 이런것들을 파악하는게 대부분의 딥러닝 종사자들은 경험이 없으면 파악이 불가능하다고 강조 하시는데 ...  이렇게 파악하기 힘든 이슈에 대한 해결책 파악도 시행착오를 수천번 겪으면서 해당 이슈에대해서 구글링을 한 일년반 이상하다 보니 파악이 불가능할줄 알았는데 파악하는데 성공했읍니다 ...  대용량 방송 서비스를 위한 수십만의 사람이 구독 신청을 하면 구독 신청을 한 사람에게 방송을 송출하는 미디어 데이터의 송수신 기술도 클라우드 서비스 RabbitMQ 의 API 함수들을 적용해서 어떻게 구현하는지를 파악을 했기에 분명 다른 해당 업체분들도 충분히 설득 되라라 생각합니다 ...      제 나이가 올해 59 세 인데 한 2 년전부터 해외 딥러닝 논문을 수백편 살펴봤었읍니다 ...   음성인식쪽을 타겟으로 잡고 딥러닝 논문을 살펴보다가 Kaldi 라는 툴이 중요한 역할을 한다는것을 알았구요     음성인식이 그동안과 최근까지 새로운 모델들의 논문들이 발표됬는데요       한 2 년 살피다 깨달은것은 Kaldi 라는 툴의 설계 구조인 HMM 모델의 세부 알고리즘 동작구조 파악이 중요하다라는것을  알게 됬구요 ...  어차피 딥러닝이 학습되려면 학습의 성능 지표가 손실함수이고 이 손실함수의 가장 기본이 되는것이  HMM 모델의 세부 알고리즘 동작구조(손실함수 포함)에 있다는것을 파악하게 됬읍니다 ...   HMM 모델의 세부 알고리즘이 거의 30 년된 이론이지만 이것을 무시할수는 없는게 딥러닝 학습 구조인것 같읍니다 ....   음성인식이 음향모델과 언어모델로 구성되 있지만 그 근간은 HMM 모델의 세부 알고리즘 이라는것이죠    제 아무리 구글 트랜스포머 모델도 HMM 모델의 세부 알고리즘의 근간의 이해 없이는 설득력이 작아지는것 같읍니다 ...  대기업 연구소 나 투자사 심사역분들은 결과물이 있냐 혹은 발표 논문이 있냐를 중요시하시는것 같읍니다 ...   딥러닝 이론의 근간이 파악되다 보니 자연스레 결과물 구현시 필요한 딥러닝 소스 세부 구현 노하우도 자연스레 파악이  되는것 같은데 ...   대기업 연구소나 투자사 심사역분들은 여전히 제 의견에 동의하지 못 하시겠죠 ?   이런 딥러닝의 근간이라는것은 단지 음성인식 분야만 국한되는것이 아니라는 점 입니다 ...   딥러닝 다른 분야 구현시에도 이 딥러닝의 근간은 똑 같이 적용된다는것을 최근에 파악했거든요 ...    그래서 딥러닝 전문가들이 기본이 되 있어야 한다 라고 하는것 같읍니다 ...

 

제가 운영하는 DMBTEC 의 장석원 개발총괄 입니다 ...

010-3350-6509

sayhi7@daum.net   으로 문의 메일 송부해 주시면 성실히 답변 드리겠읍니다 ...