Intel, AI의 언어 인식을 유용하게하다??

2021. 12. 8. 23:43IT 이야기-일반

반응형

 

사진 출처: 인텔코리아

 

 

 

안녕하세요 21세기이야기꾼입니다.

지난 7일 NeurIPS에서 음성 언어 데이터 세트에 대한 두 개의 인텔 지원 백서가 발표되었다고 합니다.

 

1. People's Speech, MSWS(Multilingual Spoken Words Corpus)

첫 번째는 The People's Speech는 "자동 음성 인식"을 대상으로, 두 번째는 MSWS(Multilingual Spoken Words Corpus)라고 합니다.

 

People's Speech 프로젝트에는 오랜 시간 감독된 대화 오디오가 포함이 되며, 학문적 또는 상업적 사용이 허가된 세계 최대의 영어 음성 인식데이터 세트 중 하나이며 무료로 다운로드할 수 있다고 합니다.

 

MSWC는 수십 개 언어로 된 300,000개 이상의 키워드가 있는 오디오 음성 데이터 세트이며 스마트 장치에서도 접속할 수 있다고 합니다.

50억명이 넘는 사람들이 사용하는 언어를 포괄하는 데이터 세트이며 전 세계의 청중을 위한 음성 응용 프로그램의 연구 및 개발을 발전시킨다고 전해집니다.

 

해당 내용은 인텔의 기사 일부를 발췌하고 번역하였으며 정확한 내용은 http://newsroom.intel.com에서 확인하실 수 있습니다.

 

언어를 데이터화하여 분석하면서 가장 어려웠던 것은 그만큼의 데이터를 확보하는 것이었다. 이제는 그것이 해결될 수도??

2. 기사를 통해 기대되는 점

언어 관련 DB를 구축할 때 가장 어려운 작업은 그 언어들을 확보하는 것이라고 할 수 있습니다.

그리고 구축된 언어 데이터에 대하여 저작권을 해결하는 것도 난관이었죠.

 

이번 인텔의 발표를 통해 자연언어를 인공언어로 변환하는 과정에서 보다 많은 양의 소스들을 확보할 수 있게 되었다고 볼 수 있습니다.

그리고 라이선스에 관해서도 매우 관대하다고 되어있는데 이게 완전 무료까지는 아닐지라도 이전보다는 나은 환경을 기대해볼 수 있을 것이라고 생각합니다.

 

다시 한 번 말씀드리지만 해당 내용은 인텔의 홈페이지에서 부분 발췌 및 번역한 것이므로 보다 정확한 내용은 

인텔 홈페이지에서 확인하여주시기 바랍니다.

 

안녕히계세요~!!

 

 

반응형