공부한 내용(41)
-
[자연어처리(NLP)] 단어 임베딩 모델 (BoW, TF-IDF, RNN, LSTM, Word2Vec, BERT)
1. 단어 임베딩(Word Embedding) 의미 : 단어를 고차원의 벡터로 표현하는 방식 -일반적으로 사람이 사용하는 자연어 자체는 컴퓨터가 이해할 수 없음 ⇒ 따라서 자연어를 컴퓨터가 이해 가능한 벡터 형태로 나타냄 2. 단어 임베딩 방법 (자연어를 벡터로 나타내는 방법) 1) 단어 빈도수에 따른 임베딩 *간단하게 단어의 빈도수에 기반해 임베딩을 구현하는 방법 (1) Bag of Words(BoW) -단어의 순서는 고려하지 않은 채 빈도만을 고려해서 자연어를 표현하는 방식 *단계 ① 각 단어에 고유한 정수 인덱스를 부여 ② 문장마다 각 단어가 등장한 횟수를 각 단어의 인덱스 위치에 기록해 벡터를 생성 (ex) 'I like movies. Movies are interesting.' 단어 I, lik..
2024.02.02 -
[언어 모델(LLM)] 디코더와 트랜스포머 전체 구조
※ 교재 요약함 1. 디코더 (Decoder) *인코더-디코더 구조, 인코더(Encoder)에서 입력 문장의 표현을 학습한 후, 해당 인코더의 결과값인 문장의 표현을 디코더의 입력값으로 사용 *디코더는 이전 디코더의 출력값과 인코더의 표현 2가지를 입력 데이터로 받음 -이때 디코더 역시 입력값에 위치 인코딩을 추가해서 입력 (단, 디코더는 각 시간 단계의 입력을 임베딩으로 변환할 때, 이전 시간 단계에서 디코더가 생성한 단어의 임베딩을 계산하므로 '입력 임베딩'이 아닌 '출력 임베딩'이라 칭함) ※디코더 입력 과정 *디코더는 매 시간 단계에서, 이전 시간 단계 인코더에서 생성한 단어와 인코더의 최종 출력값, 즉 표현을 입력으로 받음 (ex) 'I like movies' 번역 (t: time step) ①..
2024.01.12 -
[언어 모델(LLM)] 트랜스포머와 인코더
※ 교재 요약함 1.트랜스포머 (Transformer) *셀프 어텐션만 이용 -인코더-디코더 구조에, 인코더는 입력 문장의 표현 방법을 학습 ⇒ 여러 인코더를 거쳐 나오는 최종 결과가 바로 입력값의 최종 표현 결과 -인코더가 여러개 쌓인 형태를 트랜스포머라 칭함 2. 인코더 (Encoder) *인코더의 구성 요소는 '멀티 헤드 어텐션'과 '피드포워드 네트워크'로 나뉨 -멀티 헤드 어텐션을 알기 전에 '셀프 어텐션'이란 것을 알아야 함 1) 셀프 어텐션 (Self-Attention) (1) 셀프 어텐션 셀프 어텐션이란? 각각의 단어에 대한 표현을 계산하고, 동시에 다른 모든 단어의 표현과 연결해 단어가 문장 내에서 어떤 의미를 갖는지 이해하는 것 (ex) "I like movies" -이 문장을 단어로 쪼..
2024.01.11 -
[SQL] JOIN 종류 및 예시
1. Left Join SELECT (etc) FROM TableA A LEFT JOIN TableB B ON A.Key = B.Key SELECT (etc) FROM TableA A LEFT JOIN TableB B ON A.Key = B.Key WHERE B.Key IS NULL 2. Right Join SELECT (etc) FROM TableA A RIGHT JOIN TableB B ON A.Key = B.Key SELECT (etc) FROM TableA A LEFT JOIN TableB B ON A.Key = B.Key WHERE B.Key IS NULL 3. Inner Join SELECT (etc) FROM TableA A INNER JOIN TableB B ON A.Key = B.Key ..
2023.07.27 -
[파이썬] 점프 투 파이썬 - 정규 표현식
1. 정규 표현식 살펴보기 1) 정규 표현식이란? *정규 표현식(Regular Expressions) -복잡한 문자열을 처리할 때 사용하는 기법 -파이썬만의 고유 문법이 아니라 문자열을 처리하는 모든 곳에서 사용 2) 메타 문자 *메타 문자(meta characters): 원래 그 문자가 가진 뜻이 아닌 특별한 용도로 사용하는 문자 *정규 표현식에서 사용하는 메타 문자: . ^ $ * + ? {} [] \ | () 3) 문자 클래스 [ ] *문자 클래스 -메타 문자: [ ] -의미: [ ] 사이의 문자들과 매치 -[ ] 사이에는 어떤 문자도 들어갈 수 있음 (ex) [abc]: a, b, c 중 한 개의 문자와 매치 -a, b, c 중 하나라도 포함되어 있으면 매치 *[ ] 안의 두 문자 사이에 -를 사..
2023.06.20 -
[파이썬] 점프 투 파이썬 - 라이브러리
1. 파이썬 라이브러리 1) 파이썬 라이브러리 정의 *전 세계의 파이썬 사용자들이 만든 유용한 프로그램을 모아놓은 것 *파이썬을 설치할 때 자동으로 컴퓨터에 설치됨 (물론 따로 설치해야 하는 라이브러리도 존재함) 2) sys *파이썬 인터프리터가 제공하는 변수와 함수를 직접 제어할 수 있게 해주는 모듈 ① sys.argv: 명령 행에서 인수 전달하기 -파이썬 파일을 cmd 창에서 실행할 때, 어떠한 값을 파일에 전달하는 역할 argv_test.py import sys print(sys.argv) #명령 프롬프트 창에서 argv_test.py 실행 C:/python argv_test.py you need python #> ["argv_test.py", "you", "need", "python"] -명령 프..
2023.06.17