728x90 반응형 nlp3 문맥을 고려한 한국어 텍스트 데이터 증강 | Korean Text Augmentation Considering Context, K-TACC 소개 및 활용 코드 들어가며 안녕하세요! 벌써 봄이 왔네요... 밤낮으로 일교차가 있으나 2주 전에 비교하면 정말 많이 따듯해졌음을 느끼고 있습니다. 이번에 회사에서 3차년도 R&D 과제 중 콘텐츠 분류 모델을 만드는 업무를 맡게됐습니다. 물론 생각보다 목표치를 빨리 달성하게 돼서 이렇게 블로그를 쓸 시간도 생기게 됐네요. 사실 이번 업무에서는 모델을 만든다기보다는 성능 향상이 많이 필요한 상황이었습니다. 문제 제가 직면한 상황에는 총 3가지 문제가 있었습니다. 1. 데이터 총 개수가 654개로 상당히 작았습니다. 2. 기존에 만들어진 모델이 거의 깡통 모델이었습니다. 3. 과적합 해결 방안이 필요했습니다. 2번과 3번의 경우는 쉽게 해결이 가능했습니다. 그런데 1번 문제는 데이터를 더 받을 수 있는게 아니라면 해결이 불가.. 2024. 4. 5. [NLP] 한국어 형태소 분석기 Kiwipiepy Kiwipiepy Github https://github.com/bab2min/kiwipiepy GitHub - bab2min/kiwipiepy: Python API for Kiwi Python API for Kiwi. Contribute to bab2min/kiwipiepy development by creating an account on GitHub. github.com Kiwipiepy Docs https://bab2min.github.io/kiwipiepy/v0.15.2/kr/ kiwipiepy API documentation (v0.15.2) Package kiwipiepy Kiwipiepy란? Kiwipiepy는 한국어 형태소 분석기인 Kiwi(Korean Intelligent Word Id.. 2023. 7. 24. 추천 시스템 알고리즘 정리(Collaborative Filtering, Contents-based Filtering, Hybrid and Ensemble-based Filtering) 추천 시스템 알고리즘 개요 인터넷 발전에 따른 아이템 구매 및 선호에 대한 사용자의 피드백을 얻기 쉬워졌고, 이런 피드백을 바탕으로 사용자-아이템 간 데이터를 활용하여 아이템을 추천하는게 가능해졌다. 분야를 막론하고 추천 시스템 알고리즘의 활용 사례가 많이 보이고 있다. 넷플릭스(Netflix), 링크드인(Linkedin), 아마존(Amazon) 등 거대 기업들도 앞다퉈서 추천 시스템 알고리즘을 앙상블하거나 새로이 만들어낸 모델들을 이용한 서비스를 제공하고 있다. 나는 학습 플랫폼에서 사용자에게 컨텐츠를 추천해주는 모델을 개발하게 됐고, 어떤 알고리즘을 이용해야 할 지 고민중이다. 그래서 추천 시스템 알고리즘에 대해서 간략히 알아보고자 포스팅하게 됐다. 협업 필터링(Collaborative Filteri.. 2023. 7. 15. 이전 1 다음 728x90 반응형