2021. 12. 8. 23:43ㆍIT 이야기-일반
안녕하세요 21세기이야기꾼입니다.
지난 7일 NeurIPS에서 음성 언어 데이터 세트에 대한 두 개의 인텔 지원 백서가 발표되었다고 합니다.
1. People's Speech, MSWS(Multilingual Spoken Words Corpus)
첫 번째는 The People's Speech는 "자동 음성 인식"을 대상으로, 두 번째는 MSWS(Multilingual Spoken Words Corpus)라고 합니다.
People's Speech 프로젝트에는 오랜 시간 감독된 대화 오디오가 포함이 되며, 학문적 또는 상업적 사용이 허가된 세계 최대의 영어 음성 인식데이터 세트 중 하나이며 무료로 다운로드할 수 있다고 합니다.
MSWC는 수십 개 언어로 된 300,000개 이상의 키워드가 있는 오디오 음성 데이터 세트이며 스마트 장치에서도 접속할 수 있다고 합니다.
50억명이 넘는 사람들이 사용하는 언어를 포괄하는 데이터 세트이며 전 세계의 청중을 위한 음성 응용 프로그램의 연구 및 개발을 발전시킨다고 전해집니다.
해당 내용은 인텔의 기사 일부를 발췌하고 번역하였으며 정확한 내용은 http://newsroom.intel.com에서 확인하실 수 있습니다.
2. 기사를 통해 기대되는 점
언어 관련 DB를 구축할 때 가장 어려운 작업은 그 언어들을 확보하는 것이라고 할 수 있습니다.
그리고 구축된 언어 데이터에 대하여 저작권을 해결하는 것도 난관이었죠.
이번 인텔의 발표를 통해 자연언어를 인공언어로 변환하는 과정에서 보다 많은 양의 소스들을 확보할 수 있게 되었다고 볼 수 있습니다.
그리고 라이선스에 관해서도 매우 관대하다고 되어있는데 이게 완전 무료까지는 아닐지라도 이전보다는 나은 환경을 기대해볼 수 있을 것이라고 생각합니다.
다시 한 번 말씀드리지만 해당 내용은 인텔의 홈페이지에서 부분 발췌 및 번역한 것이므로 보다 정확한 내용은
인텔 홈페이지에서 확인하여주시기 바랍니다.
안녕히계세요~!!
'IT 이야기-일반' 카테고리의 다른 글
5nm 공정 RTX 40 그래픽 카드는 내년에 출시될 예정이며 NVIDIA는 TSMC의 생산 능력을 확보하기 위해 수십억 달러를 투입합니다. (0) | 2021.12.26 |
---|---|
Intel, Apple과 함께 AMD를 제치고 TSMC의 첫 3nm 클라이언트 [보고서] (0) | 2021.12.25 |
AMD RDNA 3 기반 Radeon RX 7900 XT, 7800 XT 및 RX 7700 XT 사양 [루머] (0) | 2021.12.19 |
TSMC는 N4X 프로세스의 출시를 발표했습니다! 5nm 궁극의 강화 버전: 성능 15% 향상 (0) | 2021.12.16 |
뉴스] ASML, 1.7배 칩 수축, 2.9배 증가된 새로운 새대의 고 NA EUV 리소그래피 기계 도입 (0) | 2021.12.13 |