본문 바로가기

AI46

[기술] 데이터 라벨링 툴 for Machine Learning [이미지만] 데이터 라벨링이란? 데이터 라벨링 작업은 머신러닝이나 딥러닝 모델링 작업 전에 학습 데이터에 특정 값을 부여 해주는 것이다. 이는, AI 산업의 기본이기도 하지만, 기업의 AI 사업의 획기적 발전을 이루기 위한 핵심 요소로 인식된다. 하지만, 사람이 일일이 하다 보니 비용이 많이 들고 시간이 오래 걸리는 작업이다. - 첫째, 머신러닝을 위해서는 많은 양의 데이터가 필요한데, 이미지를 분류할 때 최소 수천, 수만 장의 이미지가 요구된다. - 둘째, 시간을 포함한 많은 비용이 든다. - 라벨링 작업자가 많아질수록 일관되고 정확한 라벨링 작업이 어려워진다. 얼마나 어렵고 오래 걸리는 작업인지 보여주는 실제 사례: 영국 경제지 파이낸셜타임스(FT)는 "자율주행차 알고리즘이 도로 표지판 등을 학습하려면 수천 시간.. 2021. 4. 15.
GAN의 종류와 발전 - Style GAN을 공부할 때, 논문에서는 나오지 않고, 따로 설명에도 나오지 않는 부분이 많길레 찾아봤더니 아직 공부 안한 부분이 있더군요. 그래서 GAN의 종류와, 어떤 부분에서 발전한 것인지를 간략하게 나열합니다. 0. GAN 이안 굿펠로우가 만든 GAN은, 구조적으로는 크게 Generator와 Discriminator의 역할을 하는 두 아키텍쳐가 상호작용을 하는 Generative 모델이며, Generator는 데이터를 생성해서 Discriminator를 속이는 역할을 하고, Discriminator는 Generator가 생성한 이미지의 거짓을 밝혀내는 역할을 하도록 합니다. 즉 Loss값은, 최종단인 Discriminator가 이것이 거짓데이터인지 진짜 데이터인지를 판단하는 참 거짓의 확률 .. 2021. 4. 13.
GAN의 종류 GAN의 종류 DCGAN(Deep Convolutional GAN) 생성자와 감식자에 CNN 적용 조작된 가짜 이미지 생성 SRGAN(Super Resolution GAN) 저해상도 이미지를 고해상도 이미지로 변환 StackGAN 입력된 문장과 단어를 해석해 이미지를 생성 3D-GAN 2D 이미지를 3D 이미지로 전환 CycleGAN 이미지의 스타일을 다른 이미지로 변환 밤 사진을 낮 사진으로, 모네풍을 피카소 풍으로 DiscoGAN 서로 다른 객체 그룹 사이의 특성을 파악하여 양자 사이의 관계를 파악 가방 이미지로, 유사한 느낌의 신발 이미지 생성 2021. 4. 13.
S2FGAN 개인 공부 github.com/Yan98/S2FGAN Yan98/S2FGAN Contribute to Yan98/S2FGAN development by creating an account on GitHub. github.com 통한 코드 www.arxiv-vanity.com/papers/1907.01710/ Mask Embedding in conditional GAN for Guided Synthesis of High Resolution Images Recent advancements in conditional Generative Adversarial Networks (cGANs) have shown promises in label guided image synthesis. Semantic masks, such a.. 2021. 4. 2.
[Computer Vision] 엣지 검출(Edge Detection) Edge란? Edge pixels : 영상내 특정한 픽셀 주변의 밝기 값이 급격하게 변하는 픽셀 Edges : 엣지 픽셀들의 연속된 집합 1차원에서는 edge를 어떻게 감지할까? 1차 미분(변화량)을 구한다. = 주변 값과의 차이 미분을 수행했을 때 크기가 0이 아닌 특정한 값을 가지는 부분을 활용해 edge를 검출할 수 있다. 2차원에서는 edge를 어떻게 감지할까? image gradient를 활용한다. Gradient vector는 해당 픽셀의 변화량이 가장 급격한 방향을 가리킨다. Gradient vector와 Edge direction은 수직관계에 있다. → Gradient의 방향을 구하면 Edge의 방향을 구할 수 있게 된다. 잡음(noise)의 영향 미분 값의 크기로 edge를 찾을 수 없다.. 2021. 4. 2.
딥러닝 학습을 위한 국내외 데이터셋 현황- 이미지편 - 오늘 날 괄목할 만한 인공지능 기술과 서비스의 출현은 딥러닝을 중심으로 한 기계학습 기술의 급속한 발전에서 기인한다.특히 많은 전문가들이 딥러닝 기술의 발전 요인으로 꼽는 것이 GPU 등의 하드웨어 발전, ArXiv, Github 등으로 대변되는 적극적인 기술 공유 문화를 통한 짧은 시간내 많은 전문가들의 등장, 그리고 방대한 양의 신경망 파라미터를 효과적으로 활용가능토록 하는 대규모 학습데이터 구축 및 공개 등이다. 본 고에서는 이 요소들 중 딥러닝 학습에 널리 그리고 유용하게 활용되고 있는 대규모 공개 데이터 특히 computer vision 기술 연구에 활용되고 있는 이미지 데이터 셋에 대하여 공유한다. 글. 하정우 (네이버 Clova AI Research) 1. 범용 대규모 이미지 데이터셋 200.. 2021. 4. 2.
학습 모델의 종류 1. 비지도 학습 (Unsupervised Learning) 비지도 학습은 학습 벡터에 목표값 (target value)이 없을 때, 학습 데이터의 관계를 추론하여 학습을 진행하는 방식이다. 예를 들어, 비지도 학습에서는 고양이라는 것을 알려주지 않고 아래의 그림을 보여준다. 비지도 학습의 목표는 머신러닝 알고리즘이 아래의 [그림 1]을 보고 '네 마리의 동물은 고양이다'라고 학습하는 것이 아니라, '네 마리의 동물은 서로 같은 종'이라는 사실을 추론하는 것이다. 비지도 학습은 통계학의 밀도 추정 (density estimation)과 깊은 연관이 있으며, 머신러닝 및 데이터 마이닝 분야에서는 클러스터링 (clustering)에 많이 이용된다. 비지도 학습 또는 생성 학습 (generative learn.. 2021. 4. 1.
ANN, DNN, CNN, RNN, GAN 이란? www.youtube.com/watch?v=r7gWQicV-Yw 출처는 엔쓰리엔클라우드 유투브 입니다. 설명과 함께 들어보세요 아래는 저 혼자 공부하기 위한 기록 입니다. 딥러닝의 학습 모델 중 가장 대표적인 5가지 입니다. ANN 가장 대표적은 예시로는 퍼셉트론 Perceptron 이 있습니다. DNN ex) 대표적인 예시로는 심장 질환 환자들의 심장 박동수로 건강상태를 예측 합니다. CNN 최근 가장 인기 있는 모델입니라고 합니다. 대표적인 예시로는 알파고가 있고, 알파고는 13개의 은닉층을 사용 했습니다. ALGORITHMIA 사이트는 흑백 사진 -> 컬러 사진 으로 변경해 줍니다. demos.algorithmia.com/colorize-photos Colorize Black and White Ph.. 2021. 4. 1.
쉽게 씌어진 GAN 이 글은 마이크로소프트웨어 391호 인공지능의 체크포인트(THE CHECKPOINT OF AI)에 ‘쉽게 쓰이는 GAN’이라는 제목으로 기고된 글입니다. 블로그에는 이 글의 원제이자 윤동주 시인의 ‘쉽게 씌어진 시’를 따라 지어진 제목인 ‘쉽게 씌어진 GAN’으로 포스팅합니다. 페이스북 인공지능 연구팀의 리더이자 딥러닝의 아버지라 불리는 얀 르쿤(Yann LeCun) 교수는 GAN(Generative Adversarial Network)을 가리켜 최근 10년간 머신러닝 분야에서 가장 혁신적인 아이디어라고 말했다. 요즘 가장 주목받는 기술인 딥러닝 중에서도 GAN은 가장 많은 관심을 받고 있는 기술이다. 그만큼 GAN은 새로운 연구가 활발히 이루어지고 혁신이 빠르게 일어나고 있는 기술이기도 하다. GAN을.. 2021. 4. 1.
728x90
반응형