홈
태그
미디어로그
위치로그
방명록

분류 전체보기 (151)

ABOUT ME

-

트위터
인스타그램

Today: -

Yesterday: -

Total: -

shine_hyun shine_hyun

컨텐츠 검색 블로그 내 검색

워드임베딩

[부캠] NLP #1
AI 부캠 2021. 2. 15. 15:55

NLP Trends of NLP Naiive Bayes classifier Word embedding NLP(Natural Langauage Processing) Low-level parsing Tokenize : 데이터를 최소 의미 단의로 나누는 과정 (최소 의미란, tokenizer에 따라 다르다.) Stemming : 동사, 형용사와 같은 용언에서 문장에 쓰일 때 형태가 변하지 않는 부분을 추출 def make_tokenized(data): tokenized = [] for sent in tqdm(data): tokens = tokenizer.morphs(sent, stem=True) #tokenize with stemming tokenized.append(tokens) return tokenize..

이전

1

다음

인기포스트

ABOUT ME

New kids on the block

LINK

ADMIN

admin 글쓰기

Designed by Tistory.

티스토리툴바