목록분류 전체보기 (235)
딥 네트워크 - 딥러닝 모델 분석/네트웍 통신/카메라 3A 튜닝 분야
나이 60 인 제가 나의 그동안 거의 3 년반 딥러닝 해외논문 분석 및 딥러닝 소스 분석에 대해 애기해 보려 합니다 ... ChatGPT 의 경우도 특정 목적을 위해 GPT-3.0 을 파인튜닝한것인데 ... ChatGPT Service 의 경우도 한가지 목적(목표)만을 구현한 다음 서비스를 발표한것은 아닌것 같고, 사용자들에게 어필이 될만한 목적(목표)을 몇 가지 이상을 구현해 서비스하는것 같다 .... 나는 GPT-3.0 이 모델 구조를 공개하지 않았기 때문에 나는 처음 딥러닝을 접근하는 입장에서 GPT-3.0 으로 접근하는것 보다 구글 Transformer Language Model 로 접근하는것이 나의 공부(사업화) 목적에 더 적합하다고 판단했다 .... 내가 한 3 년 이상 공부해..
TensorFlow를 사용하여 GPU 지원이 포함된 개발 환경을 설정하는 것은 복잡한 과정일 수 있습니다. 여기에는 여러 단계가 포함되며, 각 단계는 주의 깊게 수행되어야 합니다. 다음은 제가 파악하고 있는 Ubuntu Linux에서 Nvidia A100 GPUs를 사용하여 TensorFlow 개발 환경을 설정하는 방법 소개 입니다.1. 시스템 요구 사항 확인Ubuntu Linux 운영 체제가 설치되어 있는지 확인합니다.Nvidia A100 GPUs가 시스템에 설치되어 있고 정상적으로 인식되는지 확인합니다.2. NVIDIA 드라이버 설치Nvidia 웹사이트에서 A100 GPU에 맞는 최신 NVIDIA 드라이버를 다운로드합니다.다운로드한 드라이버를 설치하기 전에, 현재 설치된 드라이버를 제거합니다.3. C..
I am 60 years old this year and have been working in the IT and telecommunications field for 30 years. It was about four years ago that I began to feel a real sense of crisis that AI would dominate everything. At my age, I started looking into research papers about four years ago, based on the work done in AI labs during my graduate school days in the 1980s. Consequently, I had to examine how de..
내 나이 올해 60 이고 IT 정보통신 분야 일한지 30 년 이다 ... 나의 경우도 세상의 흐름이 AI 가 모든것을 지배하겠다는 위기감을 본격적으로 느낀게 한 4 년전이다 ... 내 나이 60 이다 보니 예전 학생시절 80 년대에 대학원 다닐때 인공지능 그때 연구실들에서 하던 작업들을 바탕으로 한 4 년전부터 논문들을 살피기 시작했다 .... 그렇다 보니 40 년전 음성인식 영상인식 처리했던 기법들로 딥러닝 논문들이 어떻게 구현됬나를 살필수밖에 없었다 왜냐하면 내가 아는 지식이 40 년전 보고 들었던 인공지능 기법들이었기에 이것들부터 살피기 시작했다 ... 내가 4 년전부터 딥러닝 논문 살핀 방법 즉 내가 40 년전 대학원 시절 보고들었던 내용을 가지고 딥러닝 논문을 살폈으니 당연 요즘 ..
시대가 변하고 있다 .... 제작년 12 월에 ChatGPT 가 나오면서 처음에는 잘 인식을 잘 못하다가 이제 대기업에서도 ChatGPT 의 위력을 느끼고 있다 ... 물론 대기업 AI 연구소에서는 GPT-3.0 모델이 2020년 중반쯤 논문이 발표되면서 GPT-3.0 모델의 위력이 어느정도 라는것을 이미 알 사람은 다 알고 있었다 ... 일부 대기업에서는 한 1 년전 부터 ChatGPT 의 위력을 간파하고 사내에서 사용을 금지한곳도 있다 ... ChatGPT 도 이제 OpenAI 사에서도 그 위력을 충분히 간파했기에 질문자가 질문했을때 고도의 노하우는 제공되는것이 필터링이 되는것 같읍니다 ... 고도의 노하우는 기업 서비스 등의 방법으로 조금 더 많이 서비스 비용을 지불할 경우 ..
딥네트워크 :: 합성개구레이더(SAR) 도플러 효과 동작원리 분석 전문기업일인기업 딥네트워크는 SAR 위성 기술을 통해 지상의 특정 지점에서 반사되어 돌아오는 신호의 위상을 측정하고, 이를 통해 거리에 비례하는 위상 변화량을 정확하게 보정하는 설계를 구현합니다. 이 과정은 복잡한 신호 처리 알고리즘과 정밀한 계산을 필요로 합니다. 다음과 같은 SAR 위성에서 Raw Radar Data 를 처리하는 핵심 원리 노하우 확보 성공Range Compression (거리 압축)SAR 시스템은 펄스 압축 기술을 사용하여 거리 해상도를 향상시킵니다.송신된 펄스는 특정한 ‘chirp’ 신호로 변조되어, 각각의 반사 신호가 독립적인 주파수를 가지게 됩니다.수신된 신호는 매치드 필터를 통과하여, 각 반사점의 거리에 따른 ..
DeepNetwork :: Synthetic Aperture Radar (SAR) Doppler Effect Operation Principle Analysis Specialist Company DeepNetwork, a one-person company, implements a design that accurately corrects phase changes proportional to distance by measuring the phase of the signal reflected from a specific point on the ground through SAR satellite technology. This process requires complex signal processing algor..
I am 60 years old this year… I have been working in the field of Information and Communication Technology (IT) for 30 years… For the past 10 years, I have been a self-employed individual providing development services in the firmware sector of IT… I am going to talk about life in today’s world after 30 years of social life… From now on, I have been reviewing and analyzing 2-3 papers related to L..
Hello, I am Seokwon Jang from DeepNetwork, specializing in technical consulting for the lightweight implementation of ultra-large language models. I have been examining the status of Korean ultra-large model development companies (mainly large corporate AI research institutes) through articles. Implementing an ultra-large language model also requires preparing a massive amount of precise trainin..
I have finally succeeded in understanding the theory of Kalman filters, which are applied in missile attitude control or robot attitude control. It’s been almost 2 years since I started analyzing this. Everything was so complicated due to difficult technical terms and complex formulas. After about a thousand trials and errors, I am delighted that all the things that were curious and unresolved h..
Hello, I am Seokwon Jang, the representative and chief developer of DeepNetwork, a one-person company. I run a company that provides optical character recognition (OCR) solutions based on deep learning. OCR is a technology that recognizes characters written or printed by people, characters in photographed or scanned images, and converts them into digital text that machines can read and edit. I a..
I am 60 years old this year… I have been working in the field of Information and Communication Technology (IT) for 30 years… For the past 10 years, I have been a self-employed individual providing development services in the firmware sector of IT… I am going to talk about life in today’s world after 30 years of social life… From now on, I have been reviewing and analyzing 2-3 papers related to L..
레이더나 미사일에 적용되는 9 축센서 상용과 군용의 차이점은 주로 성능과 내구성에 있습니다. 군용 센서는 상용 센서보다 더 높은 온도, 습도, 진동, 충격, 방사선 등의 극한 환경에 견딜 수 있도록 설계되어 있습니다. 또한 군용 센서는 상용 센서보다 더 정확하고 안정적인 데이터를 제공하기 위해 더 높은 해상도와 샘플링 레이트를 가질 수 있습니다. 그러나 이러한 차이는 센서의 제조사와 모델에 따라 다를 수 있다 ... 나는 일인기업이다 보니 9 축센서 파악한 부분도 대부분이 상용 9 축 센서에 대한것 들이다 ... 가속도, 자이로스코프, 자력계의 9 축 센서의 센서데이터를 쿼터니언 값으로 변환해서 레이더나 미사일에 적용한다 ... 가속도, 자이로스코프, 자력계의 9 축 센서의 센서데이터로 부..
DeepNetwork: Pioneering AI Solutions with Proximal Policy Optimization and Reinforcement Learning with Human Feedback At one-person enterprise DeepNetwork, we specialize in providing expert technical advisory services in the field of deep learning and artificial intelligence. Our primary focus is on the application and understanding of advanced reinforcement learning algorithms, particularly the..
I am 60 years old this year and have been working in the IT software development field for 30 years. I started analyzing deep learning papers about 4-5 years ago… Initially, I started analyzing papers to apply deep learning to the vision field… Then, I also analyzed papers to understand the detailed structure of ultra-large language models… When implementing ultra-large language models, I looked..
제가 운영하는 딥네트워크 에서는 탱크의 수위를 측정하기 위해 Analog Devices 의 3D Time of Flight (ToF) 기술을 사용하여 깊이 정보를 캡처하는 데 사용되는 칩셋을 사용합니다. 이 기술은 고전력 광 펄스를 사용하여 관심 있는 장면에서 깊이 정보를 캡처합니다. 이러한 칩셋 중 하나는 ADSD3100 ToF 신호 프로세서를 기반으로 하는 깊이 이미지 신호 프로세서인 ADTF3175입니다. 이러한 단계를 따르면, ToF 원리를 사용하여 탱크의 액체 수준을 측정하는 시스템을 설계하고 구현할 수 있습니다. Analog Devices에서는 3D Time of Flight (ToF) 기술을 사용하여 깊이 정보를 캡처하는 데 사용되는 칩셋을 제공합니다. 이 기술은 고전력 광 펄스를 사용하여 ..
NXP’s MC33771C is a 14-channel lithium-ion battery cell controller IC that can monitor the status of each cell. Cell state monitoring: These chipsets monitor the status of each cell through high-precision cell voltage and temperature measurements. They use ADC conversion to measure the difference in cell voltage, and average a maximum of 256 samples to increase accuracy. Overcharge, overcurrent,..
“The GPT-3 model, which applies the theory of conditional probability to large-scale language models to predict the next word, was trained and applied to create GPT-3.5, which has shown remarkable performance. However, when you look closely, the learning algorithm itself does not differ significantly from the learning algorithm based on the design principles of Google’s Transformer. Rather, the ..
I am Seokwon Jang, a technical advisor specializing in ultra-large model technology at DeepNetwork. I approached the commercialization preparation of the ultra-large language model, ChatGPT, somewhat vaguely three years ago. In fact, many corporate officials may wonder if a one-person company like me can understand the implementation know-how of an ultra-large language model like ChatGPT. For ov..
초거대 모델 기술자문 전문 딥네트워크 장석원 입니다 ... 초거대 언어 모델 ChatGPT 의 상용화 준비를 하는것에 나도 3 년전에는 약간 막연하게 접근했다 ... 사실 ChatGPT 같은 초거대 언어 모델의 구현 노하우를 저 같은 일인기업이 파악이 가능하기나 하냐 라고 의문을 가지는 기업 관계자가 많을것 입니다 ... 제가 그동안 한 3 년 이상 LLM(거대언어모델)관련 해외 논문을 3 년 동안 매일 매일 하루에 두편씩 세부 검토 분석을 해왔읍니다 ... 이렇게 한 3 년 논문을 검토 분석하다 보니 초거대 모델 구현시 글로벌 기업들이 관련 기술이슈를 어떤것들을 고민하는지를 알게됬읍니다 ... 제가 그동안 3 년동안 논문을 검토 분석한 내용은 대략적으로 딥러닝 분야 구현 설계 핵심 이슈 한 100 가지..
The 900GB/s bandwidth between the Grace CPU and NVIDIA Hopper GPU is made possible by NVIDIA’s NVLink-C2C technology. This technology connects the CPU, GPU, and memory in a memory-coherent, high-bandwidth, low-latency manner. It provides a bandwidth that is 7 times faster than PCIe Gen5. NVLink-C2C combines the Grace CPU and Hopper GPU into a single superchip, providing a CPU+GPU coherent memory..
딥네트워크 :: 합성개구레이더(SAR) 도플러 효과 동작원리 분석 전문기업일인기업 딥네트워크는 SAR 위성 기술을 통해 지상의 특정 지점에서 반사되어 돌아오는 신호의 위상을 측정하고, 이를 통해 거리에 비례하는 위상 변화량을 정확하게 보정하는 설계를 구현합니다. 이 과정은 복잡한 신호 처리 알고리즘과 정밀한 계산을 필요로 합니다. 다음과 같은 SAR 위성에서 Raw Radar Data 를 처리하는 핵심 원리 노하우 확보 성공Range Compression (거리 압축)SAR 시스템은 펄스 압축 기술을 사용하여 거리 해상도를 향상시킵니다.송신된 펄스는 특정한 ‘chirp’ 신호로 변조되어, 각각의 반사 신호가 독립적인 주파수를 가지게 됩니다.수신된 신호는 매치드 필터를 통과하여, 각 반사점의 거리에 따른 ..
The one-person enterprise, DeepNetwork, is developing a Transformer model in the TensorFlow development environment. TensorFlow is an open-source machine learning framework created by Google, which allows you to easily and quickly build and deploy deep learning models on various platforms. TensorFlow provides official tutorials and APIs for implementing the Transformer model. Here are the key po..
Hello, I am DeepNetwork, a one-person enterprise specializing in the analysis of super-large AI models. Over the past 3 years, DeepNetwork has conducted detailed review and analysis of hundreds of deep learning papers related to super-large models, and has also carried out detailed analysis work on Google’s deep learning environment, TensorFlow. While DeepNetwork does not have solutions for all ..
I have been working in the IT field for 30 years… Lately, there’s a buzz that Nvidia’s market capitalization is around 2 trillion dollars…” Nvidia has been manufacturing GPUs such as V100 / A100 / H100 at TSMC in Taiwan… The issue of super-large language models is flooding the media in Korea and abroad… Global companies are desperate to secure the original technology of how to develop something ..
나는 IT(정보통신) 분야 일을 한지 30 년 이다 ... IT(정보통신) 분야 일을 하는 사람들도 공대에서 컴퓨터공학과나 전자공학과를 4 년 배웠어도 데기업 이든 중소기업 이든 입사하면 쌩 초보 역할밖에 할수 있는게 없다 ... 왜냐하면 공대에서 4 년을 컴퓨터 프로그래밍 이나 회로 설계 같은걸 배우긴 하는데 아무래도 회사에 입사해서 바로 써 먹을 실력은 안되기 대문이다 ... 이렇게 공대 4 년 배우고 회사를 들어가도 최소 10 년은 정보통신 분야 일을 경험을 해봐야 대학때는 안 가르쳐줬던 수십 수백가지 가지가지 수많은 여러 기법들을 회사에서 배우고 경험해야 비로서 한 분야 나름 이름값도 가능하다 ... 가수 분야 특히 예능 분야인 경우 중학교 고등학교 때부터 예술 고교가면 중고교 부터 가수가 터득해..
IT 분야에서 일한지 30 년이다 ... 요즘 엔비디아 시총이 2400조 라고 떠들석 하다 ... 엔비디아는 그동안 GPU 를 V100 / A100 / H100 을 대만 TSMC 에서 제조해왔다 ... 요즘 초거대 언어 모델 이슈가 한국이나 외국 언론을 도배하고 있다 ... 초거대 모델 GPT-3.5 같은걸 어떻게 개발하는가의 원천 기술을 확보하려고 글로벌 기업들이 혈안이 되있다 ... 이런 GPT-3.5 Model 같은 경우도 세부 모델 설계 구조 정보는 대외비이고 GPT-3 의 경우도 모델 설계 구조는 비공개로 알고 있다 ... 그래서 EleutherAI 이라는 GPT-3 의 오픈소스 버전인 GPT-J 모델을 학습하여 공개했다고 하고 이것을 기반으로 개발준비를 하는곳도 꽤 있는듯 하다 ... 왜냐하면..
안녕하세요 ? 인공지능 초거대 모델 분석 전문 일인기업 딥네트워크 입니다 ... 딥네트워크는 그동안 3 년 이상 초거대 모델 등등 관련 딥러닝 분야 논문을 최소 몇백편을 세부 검토분석을 했고 구글의 딥러닝 개발환경인 텐서플로우 환경에 대해서도 세부 분석작업을 진행했읍니다 ... 딥네트워크는 현재 초거대 모델의 모든 이슈에 대해 해결방안이 있는것은 아니지만 일부 이슈에 대한 해결 방안은 확보하고 있읍니다 ... 초거대 모델의 가능성을 확실히 제시한 GPT-3 모델의 세부분석은 나름 자신있게 분석되 있읍니다 ... 요즘엔 LLM 의 개발 이슈가 sLLM 으로 옮겨 가고 있고 또 그래서 딥네트워크 또한 sLLM 세부 이슈에 대한 기술 이슈 연구를 진행해서 나름 의미있는 분석 결과물도 확보하고 있읍니다 ... ..
딥네트워크는 초거대 언어 모델인 ChatGPT의 세부 설계 구조 분석에 대한 깊은 이해를 바탕으로 다양한 분야에서 활용할 수 있는 정보를 제공하고 있습니다. 아래에서 ChatGPT의 기술적 세부 사항과 학습 원리, 데이터에 대한 분석 정보를 단계별로 설명드리겠습니다. ChatGPT란? ChatGPT는 OpenAI에서 개발한 생성형 인공지능 모델로, 주로 자연어 처리 작업(Natural Language Processing, NLP)을 위해 설계되었습니다. 이 모델은 Narrow AI에서 General AI로 향해 가는 변곡점을 나타내며, 다양한 작업에 적용될 수 있습니다. 그러나 여전히 진정한 의미의 General AI는 아닙니다. ChatGPT의 기술적 세부 사항 ChatGPT는 GPT-3.5 모델을 기..
일인기업 딥네트워크의 딥러닝 기반 광학문자 인식 솔루션 이슈 분석 내용 입니다 ... 안녕하세요. 저는 일인기업 딥네트워크의 대표이자 개발총괄인 장석원입니다. 저는 딥러닝 기반 광학문자 인식 솔루션을 제공하는 회사를 운영하고 있습니다. 광학문자 인식이란 사람이 쓰거나 인쇄한 문서, 촬영된 사진이나 스캔된 이미지 내의 문자를 인식하여 기계가 읽고 편집할 수 있는 디지털 텍스트로 변환하는 기술을 의미합니다. 저는 이러한 기술을 다양한 분야에 적용할 수 있는 솔루션을 개발하고 있습니다. 저는 최신의 딥러닝 기술인 ViT 모델을 광학문자 인식쪽 이슈를 분석하였습니다. ViT 모델은 이미지를 고정 크기의 패치로 나누고, 각 패치를 임베딩 벡터로 변환하여 Transformer의 입력으로 사용하는 모델입니다. Tra..