메인메뉴로 이동 본문으로 이동

컨텐츠 내용

  1. 고객센터
  2. OSS뉴스

OSS뉴스

OSS뉴스 조회 페이지
인공지능 코드 이해와 번역을 위한 대규모 데이터세트...'프로젝트 코드넷' 오픈소스로 공개 관리자 / 2021.05.12

인공지능 코드 이해와 번역을 위한 대규모 데이터세트...'프로젝트 코드넷' 오픈소스로 공개

 

IBM 연구소, 코드 이해와 번역을 가능하게 하기 위해 1400만 개의 코드 샘플, 5억 줄의 코드 및 55개의 프로그래밍 언어로 구성된 대규모 데이터세트

IBM 연구소  '프로젝트 코드넷(Project CodeNet)'을 오픈 소스로 공개

이미지 출처: 인공지능신문

 

 

IBM 연구소는 인공지능(AI)의 코드 이해와 번역을 가능하게 하기 위해 1400만 개의 코드 샘플, 5억 줄의 코드 및 55개의 프로그래밍 언어로 구성된 대규모 데이터세트인 '프로젝트 코드넷(Project CodeNet)'을 오픈 소스 11일(현지시간) 공개했다.

이 프로젝트 코드넷은 현재 동급 최대 규모의 가장 차별화된 데이터세트이며, 오늘날 코딩에서 코드 검색(COBOL과 같은 기존 언어를 포함하여 한 코드를 다른 코드로 자동 변환), 코드 유사성(서로 다른 코드 중에서 중복 및 유사성 식별), 코드 제약(개발자의 특정한 요구와 매개변수에 기초한 사용자 지정 제약 조건)의 세 가지 주요 사용 사례를 다룬다. [기사 전문 보기]


[출처] 인공지능신문(http://www.aitimes.kr/news/articleView.html?idxno=20997)