돌아가기 AI는 오픈 소스입니다.
중국 인터넷 말뭉치 리소스 플랫폼 오픈 소스 데이터

중국 인터넷 말뭉치 리소스 플랫폼 오픈 소스 데이터

AI는 오픈 소스입니다. Admin 4 회 조회

1. 플랫폼 배경

중국사이버공간보안협회(China Cyberspace Security Association)와 국가인터넷비상대응센터(National Internet Emergency Response Center)가 출범한 이 센터는 인공지능 모델 훈련, 자연어 처리 연구 및 기타 애플리케이션을 지원하기 위해 고품질의 신뢰할 수 있는 중국 인터넷 말뭉치 리소스를 제공하는 것을 목표로 합니다.


2. 자원 특성

이 플랫폼은 총 볼륨이 약 2.7TB인 27개의 데이터 세트를 포괄하는 "중국 인터넷 기본 말뭉치 2.0"을 출시했으며, 그 중 기본 말뭉치 부분은 약 120GB이며 약 3,800만 개의 데이터를 포함합니다. 모든 데이터는 소스를 확인하고, 콘텐츠를 필터링하고, 중복 제거하여 콘텐츠의 정확성과 신뢰성을 보장합니다.


3. 오픈 소스 가치

등록 및 인증 후 과학 연구 및 산업 등 다양한 요구를 충족하고 오픈 소스 생태계의 발전을 촉진하며 중국 분야에서 대형 모델 및 자연어 처리 기술의 혁신과 적용을 촉진하기 위해 다운로드 및 사용할 수 있습니다.


자세한 내용은 공식 홈페이지를 참고하세요

:

https://corpus.cybersac.cn/?home#/index

추천 도구

더보기