국립국어원은 인공지능(AI) 학습용 한국어 자료 11종(신규 8종, 정비 3종)을 지난 1일 공개했다.
이번에 공개된 자료는 35개 매체의 2021년 신문 기사, 2003년부터 2020년까지 만들어진 국회 소위원회 회의록, 온라인상 대화 등이다. 한국어의 특성을 반영해 속성 기반으로 감성을 분석한 말뭉치, 일반인이 문장에서 추측할 수 있는 가설을 확신하는 정도를 표시한 추론 확신성 말뭉치도 있다.
이 밖에 개체명 분석 말뭉치에 위키피디아의 지식 정보를 연결한 개체 연결 자료, 인공지능이 인터넷상의 우리말 자료를 쉽게 분석할 수 있도록 교정한 맞춤법 교정 말뭉치도 공개됐다. 온라인 약정서를 작성해 승인받으면 누구나 이용할 수 있다.
<말뭉치 신청 절차>
닫기이미지 확대 보기
Copyright ⓒ 서울신문 All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지
이재명 대통령이 지난 달 한 공식석상에서 로스쿨 제도와 관련해 ”법조인 양성 루트에 문제가 있는 것 같다. 과거제가 아니고 음서제가 되는 것 아니냐는 걱정을 했다“고 말했습니다. 실질적으로 사법고시 부활에 공감한다는 의견을 낸 것인데요. 2017년도에 폐지된 사법고시의 부활에 대해 여러분의 생각은 어떤가요?