Java5 [NLP] Open Korean Text 자바로 구현 몇년 전에 파이썬의 konlpy 라이브러리를 이용해서 okt를 써보았던 적이 있다. konlpy는 한국어 정보처리를 위한 파이썬 패키지로, 여러 종류의 한국어 자연어 처리기를 쉽게 사용할 수 있도록 돕는다. 나는 이번에 okt를 스프링부트에서 사용하기 위해서 자바로 직접 사용해보았다. 1. gradle 인코딩을 utf-8로 설정한다. tasks.withType(JavaCompile) { options.encoding = 'UTF-8' } 그 후 dependencies에 다음을 추가한다. implementation('org.openkoreantext:open-korean-text:2.1.0') 2. 분석코드 분석을 위해 작성한 클래스다. analyseText 함수는 파라미터로 text와 선택할 품사태그배열.. 기록/그 외 프로젝트 기록 2022. 10. 10. [PG] 뉴스 클러스터링 - JAVA 1. 문제 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 여러 언론사에서 쏟아지는 뉴스, 특히 속보성 뉴스를 보면 비슷비슷한 제목의 기사가 많아 정작 필요한 기사를 찾기가 어렵다. Daum 뉴스의 개발 업무를 맡게 된 신입사원 튜브는 사용자들이 편리하게 다양한 뉴스를 찾아볼 수 있도록 문제점을 개선하는 업무를 맡게 되었다. 개발의 방향을 잡기 위해 튜브는 우선 최근 화제가 되고 있는 "카카오 신입 개발자 공채" 관련 기사를 검색해보았다. 카카오 첫 공채..'블라인드' 방식 채용 카카오, 합병 후 첫 공채.. 블라인드 전형으로 개발자 채용 카카오, 블라인드.. 코딩테스트/PROGRAMMERS 2022. 9. 24. [JAVA] System.arraycopy, Array.clone() 보호되어 있는 글 입니다. 2022. 5. 1. [JAVA] 예외처리의 비용 예외처리에도 비용이 있다. [이 문제]를 풀다가 처음 발견했다. 더 자세한 내용은 [Exceptions are slow in Java] 라는 포스팅을 읽고 알게되었다. 1. Filling in the stack trace is slow 한 예외마다 대략 1~5ms정도의 시간이 걸린다. 이 대부분의 시간은 exception thread stack을 채우는 데 걸리는 시간이다. stack trace가 깊을 수록, 더 오랜 시간이 걸린다. 대부분의 경우 예상할 수 없는 문제에 exception을 던지기 때문에 생성될 exception이 얼마나 많은 시간이 걸릴 지 알 수 없는 것도 문제다. 2. How to avoid the stack trac penalty? Using non-exceptional metho.. 기록/JAVA 2022. 4. 30. [JAVA] StringBuilder의 insert, append insert StringBuilder의 insert메서드는 다시 AbstractStringBuilder의 insert메서드를 실행한다. insert 메서드 내에서 직접 한 번, str.getChars() 메서드 안에서 한 번 호출되어 총 System.arraycopy() 메서드가 두 번 호출된다. //AbstractStringBuilder.java 클래스 public AbstractStringBuilder insert(int offset, String str) { if ((offset length())) throw new StringIndexOutOfBoundsException(offset); if (str == null) str = "null"; int len = str.. 기록/JAVA 2022. 3. 10. 이전 1 다음