Dataset(데이터셋)
인공지능을 개발하기 위해서 필수적으로 갖춰져야 할 것은 많은 데이터입니다.
데이터가 많을수록 학습의 정확도가 높아지고 예측을 더 정확하게 할 수 있습니다.
또한 좋은 인공지능을 만들려면 인공지능에게 학습시키는 데이터의 질이 매우 중요합니다.
특정한 작업을 위해서 데이터를 관련성 있게 모아놓은 것을 데이터셋 이라고 하며 여러 형식으로 된 자료를 포함할 수 있습니다. 데이터 파일, 또는 데이터베이스라고도 부르며 컴퓨터가 처리, 분석할 수 있는 정보의 세트를 말합니다.
기계 학습에 필요한 데이터를 수집하기 위해서는 엄청난 시간과 노력이 필요합니다. 하지만 모바일이나 웹상에서 공유되고 기록되는 정보와 데이터를 가지고 분석에 사용할 수 있습니다. 또한 데이터셋을 기관과 기업에서 공개함으로써 투명성을 유지하고 이를 활용하여 더 나은 인공지능 프로그램을 개발할 수 있게 하기도 합니다.
출처 : http://computing.or.kr/14565/dataset%EB%8D%B0%EC%9D%B4%ED%84%B0%EC%85%8B/
간단하게,
DataSet은 (DB의)DataBase
DataTable은 (DB의)Table
한마디로 DataSet안에 여러 개의 DataTable이 들어 갈 수 있다.
DataTable은 메모리상에 테이블을 표현하고,
DataSet은 메모리의 테이블들을 가지고 있으며, 일반적으로 서버로부터 테이블을 가져와 메모리상의 DataSet에 할당한 후 사용한다.
출처: https://crazykim2.tistory.com/11 [잡다한 프로그래밍]
'AI > 딥러닝' 카테고리의 다른 글
CNN: Single-label to Multi-label (0) | 2021.06.04 |
---|---|
[Object Detection] Darknet 학습 준비하기 (0) | 2021.06.04 |
GAN 동작 원리 (참고 링크) (0) | 2021.04.21 |
[기술] 데이터 라벨링 툴 for Machine Learning [이미지만] (0) | 2021.04.15 |
GAN의 종류와 발전 (0) | 2021.04.13 |
댓글