Notice
Recent Posts
Recent Comments
Link
Tags
- defaultdict
- Strip
- 자연어처리
- selectional preference
- 동시 출현
- cooccurrence
- selectional association
- 인사이드
- 동사 술어
- L1 Distance
- 유사도
- 파이썬
- nlp
- Infinity Distance
- 선택 선호도
- Sliding Window
- KoNLPy
- back propagation
- 거리 재기
- 자연어 처리
- 자카드 유사도
- 워드 임베딩
- 명사 클래스
- word2vec
- 슬라이딩 윈도우
- L2 Distance
- 클래스
- 워드투벡
- 벗기다
- 역전파
Archives
- Today
- Total
목록워드투벡 (1)
SILVERCitYz
word2vec
참고자료: https://towardsdatascience.com/word2vec-from-scratch-with-numpy-8786ddd49e72 import re def tokenize(text): # obtains tokens with a least 1 alphabet pattern = re.compile(r'[A-Za-z]+[\w^\']*|[\w^\']*[A-Za-z]+[\w^\']*') return pattern.findall(text.lower()) def mapping ( text ) : word_to_id = {} id_to_word = {} for i, word in enumerate(set(text)) : word_to_id[word] = i id_to_word[i] = word ret..
카테고리 없음
2020. 4. 2. 21:47