[기술컨설팅 가능 합니다] OpenAI 가 발표한 Text To Video 의 SORA 모델의 세부설계 구조와 원리 파악에 성공해 기분 좋다 ... :: GPT-3 LLM 세부 알고리즘 분석 일인 AI 스타트업 딥네트워크

[기술컨설팅 가능 합니다] OpenAI 가 발표한 Text To Video 의 SORA 모델의 세부설계 구조와 원리 파악에 성공해 기분 좋다 ...

파란새 2024. 2. 18. 02:01

2024. 2. 18. 02:01

OpenAI 가 발표한 Text To Video 의 SORA 모델의 세부설계 구조와 원리 파악에 성공해 기분 좋다 ... 그동안 디퓨젼 모델 도 분석을 했던게 큰 도움이 된것 같다 Sora는 트랜스포머 아키텍처를 기반으로 하며, 비디오와 이미지를 패치라는 작은 데이터 단위로 표현한다. 이를 통해 다양한 길이, 해상도, 종횡비를 가진 시각 데이터에 대해 효율적으로 학습할 수 있다. Sora는 DALL-E의 리캡션기법을 사용하여 생성된 비디오에서 텍스트 프롬프트를 더 잘 따르도록 한다. 리캡션기법은 시각적 훈련 데이터에 대해 설명력이 높은 캡션을 생성하는 방법이다. 그리고 Text to Image Model 세부 구조 분석이 됬던 부분이 Sora Model 이해하는데 도움이 된것 같다 ... Text to Image Model은 트랜스포머 아키텍처를 기반으로 하며, 이미지를 패치라는 작은 데이터 단위로 표현한다. 이를 통해 다양한 해상도, 종횡비를 가진 시각 데이터에 대해 효율적으로 학습할 수 있다.

이런 부분들 이야기해 볼수 있는 업체의 연락을 기다립니다 ....

딥네트워크 장석원 010-3350 6509 이메일 sayhi7@daum.net

저작자표시 비영리 변경금지

'Kernel Porting > Linux' 카테고리의 다른 글

챗GPT 가 앞으로 일년 어떻게 세상을 바꿀지 아무도 예측 불가인 세상이라 나도 이런 챗GPT 딥러닝 논문 분석 연구를 하는 사람으로써 세상은 변하기 싫어도 변할수 밖에 없을것 이다 (0)	2024.02.19
[기술컨설팅 가능합니다] 반도체 공정중 원자층 증착(Atomic Layer Deposition, ALD)의 핵심 원리를 이해하는데 성공했다 ... (0)	2024.02.18
[초거대 언어 모델 딥러닝 구현 기술 및 모델 경량화 구현 커스토마이징 기술자문 가능][초거대 언어 모델 딥러닝 논문 400 편 이상 분석 경험 있음] (2)	2024.02.13
[펌웨어 개발용역 / 기술자문 전문] STM32H743 과 Nordic nRF52840 펌웨어 개발전문 일인기업 딥네트워크 장석원 입니다 ... (1)	2024.02.13
오늘은 요즘 온 디바이스 AI 의 이슈인 초거대 모델 경량화 에 대해 조금 이야기 하려 한다 ... (0)	2024.02.08

+ Recent posts

Powered by Tistory, Designed by wallel

티스토리툴바