일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Machine Learning
- 어노테이션
- javascript
- Test Coverage
- 스프링 부트
- 자료구조
- react
- 구버전
- jQuery
- JPA
- bean
- 리액트
- ES6
- Deep Learning
- 제이쿼리
- 하이브리드앱
- annotation
- data structure
- kotlin
- C++
- log4j2
- spring
- 자바스크립트
- 스프링
- cache
- AWS
- 테스트 커버리지
- Java
- spring boot
- transformer
- Today
- Total
목록Model (2)
박서희연구소
Transformer 모델은 자연어의 순서를 이해하지 못한다Transformer 모델은 순차적으로 데이터를 처리하지 않기 때문에 입력 텍스트의 순서를 직접적으로 인식하지 못한다.이는 RNN(Recurrent Neural Network) 및 LSTM(Long Short_term Memory) 모델과 가장 큰 차이점으로, Transformer는 입력 토큰 간 관계를 병렬적으로 처리한다. 문제: 단순히 토큰을 병렬로 처리하면, "I love AI"와 "AI love I"가 모델에게 동일하게 보일 수 있음해결: 위치 인코딩(Positonal Encoding)Transformer는 입력 토큰의 위치 정보를 반영하기 위해, 위치 인코딩을 사용Sine 및 Cosine 함수로 위치를 나타내는 고유한 벡터를 생성이 벡..
Transformer 모델 소개Transformer 모델은 NLP(자연어 처리) 분야에서 큰 변화를 가져온 딥러닝 모델이며, 번역, 요약, 질의응답 등 다양한 자연어 처리 작업에서 뛰어난 성능을 보여준다.Transformer 모델은 무엇인가?Attention 메커니즘을 중심으로 동작하는 신경망 모델로, 입력 문장의 모든 단어간 관계를 한 번에 파악할 수 있다.기존의 RNN(순환 신경망)이나 LSTM과 달리 순차적으로 데이터를 처리하지 않아도 되기 때문에 학습 속도가 빠르고, 긴 문장에서도 효과적으로 학습할 수 있다. 왜 중요한가?병렬 처리 가능: RNN은 순서대로 데이터를 처리해야 하지만, Transformer는 병렬로 데이터를 처리할 수 있어 학습 속도가 빠름장거리 의존성 처리: Attention 메..