News
-
[소식] NHN클라우드, AI Tech+ 2023 참가… “AI시대, NHN클라우드와 함께 대응해요!”
파트너사, 지역 참여 기업과 NHN Cloud AI Pavilion 결성해 AI솔루션·플랫폼 홍보 부스 공동 운영 ‘세상을 바꿀 생성형 AI’ 주제로 박근한 본부장 발표 진행… 개발 중인 버티컬 생성형 AI기술 공개 ㅡ [NHN Cloud, 2023-08-30] 엔에이치엔 클라우드(NHN Cloud, 공동대표 백도민, 김동훈, 이하 NHN클라우드)는 광주시가 주최하는 AI Tech+2023 박람회에 참여해 파트너사 및 지역 참여 기업과 공동 부스를 운영하고 주제발표를 진행한다고 30일 밝혔다. 2022년 처음 개최된 AI Tech+은 국내외 최신 인공지능 기반 기술과 서비스, 융합산업의 트렌드를 경험할 수 있는 호남 최대 규모의 인공지능산업 전시회로 올해는 8월 30일부터 9월 1일까지 3일 간 광주시 ..
-
[소식] NHN클라우드, General OCR 출시… 국제 챌린지 리더보드 상위권 들며 성능 입증
[2023.07.13] 문서, 간판, 표지판, 포스터 등 모든 이미지 내 글자 판독해 보관 및 활용할 수 있어 준지도학습 기술 적용해 데이터 라벨링 작업 없이 이미지 수집만으로 문자 인식 모델 성능 제고 국제 컴퓨터 비전 학회 ‘ECCV’ 주최 OOV 챌린지 리더보드에 알고리즘 제출해 높은 판독률 기록 ㅡ 엔에이치엔 클라우드(NHN Cloud, 공동대표 백도민, 김동훈, 이하 NHN클라우드)는 모든 종류의 이미지 내 글자를 판독할 수 있는 신규 클라우드 상품 ‘General OCR(범용 광학식 문자판독 기술, 이하 범용 OCR)’ 서비스가 국제 챌린지 리더보드 상위권에 들며 성능을 입증했다고13일 밝혔다. NHN클라우드가 자체 개발한 범용 OCR은 일반 문서를 비롯해 간판, 교통 표지판 등 일상 속 모든..
-
[소식] [AI의 산업접목④] AI전환 시대, 기술기업 NHN클라우드의 상생 전략은?
[2023.05.30] 디지털데일리가 NHN클라우드의 AI 상생 전략을 소개하였습니다. AI데이터센터를 통해 인공지능 산업 생태계 구성원들에게 개발 인프라를 제공함과 동시에, 사업군별 특화 AI서비스를 통해 기업들의 AI 전환을 돕고 사회공헌을 실천하는 점이 자세히 설명되어 있습니다. 뉴스보기 ▶ https://n.news.naver.com/mnews/article/138/0002149454?sid=105 - [AI의 산업접목④] AI전환 시대, 기술기업 NHN클라우드의 상생 전략은?
-
[소식] NHN클라우드, AI EXPO 2023 참가… 실생활 속 AI · 클라우드 솔루션 출품
[2023.05.04] 엔에이치엔 클라우드(NHN Cloud, 공동대표 백도민, 김동훈, 이하 NHN클라우드)는 에 자사 AI 및 클라우드 솔루션을 출품한다고 4일 밝혔다. 올해로 6회차를 맞이한 AI EXPO KOREA 2023는 국내 최대 인공지능 전문 전시회로 서울 코엑스에서 5월 10일(수)부터 12일(금)까지 3일간 진행된다. NHN클라우드는 AI솔루션으로 ▲얼굴 감지 및 분석, 비교를 포함한 얼굴 인식 관련 다수 서비스를 제공해 다양한 상황에서 활용가능한 ‘AI Face Recognition’ ▲다양한 카테고리의 상품 데이터를 기반으로 학습해 이미지 내 상품 검색은 물론, 유사 상품 추천 등 패션 분야 특화 서비스를 제공하는 ‘AI Fashion’ ▲신용카드, 사업자등록증, 차량번호판 등 다양..
Tech Blog
-
[AI Human] 발화 인물 영상 생성 기술
NHN AI 팀에서는 AI Human이 말하는 영상을 생성하는 기술을 개발하고 있습니다. AI Human 영상을 생성하기 위해선 우선 텍스트로 음성을 합성하는 음성합성 기술과, 이 음성을 입력으로 받아 말하는 영상 이미지를 만드는 영상합성 총 2가지 종류의 기술이 필요합니다. 그 중 음성 합성과 관련된 영상은 https://ai.nhncloud.com/62 이 링크의 글에서 정리하고 있으며 이번 포스팅에서는 후자의 영상 합성과 관련된 기술을 소개하고, 이후 발전 및 개선된 연구들을 다뤄보려고 합니다. Synthesizing Obama 오바마 영상합성 기술 2017년 컴퓨터 그래픽스 학회인 SIGGRAPH 에서 오바마의 딥페이크 영상을 음성만으로 생성할 수 있는 기술이 등장하였습니다. 당시 CycleGAN..
2024.01.02 11:49 -
[Document AI] OCR을 넘어서서 문서의 내용을 이해하는 AI
이번 글에서는 최근 주목받고 있는 Document AI 분야에 대해서 알아보고 OCR 기술의 주요 연구 트렌드에 대해서 살펴보고 향후 OCR 기술의 발전 방향에 대해서 예상해 보도록 하겠습니다. OCR 분야의 최신 연구 흐름 기존의 OCR 기술은 문서 내의 글자만을 판독하는 목적으로 주로 사용이 되었습니다. 아래의 그림과 같이 주로 Text Detection과 Text Recognition의 두 단계로 구성되는 것이 일반적입니다. 최근에는 이 두 단계를 End-to-End 구조로 통일하는 연구들이 소개되는 추세입니다. AI 분야의 연구가 발전함에 따라서 이미지 혹은 문서 내에서 글자만을 추출하는 것이 목적이었던 기존의 OCR을 넘어서서 문서의 내용을 이해하여 좀 더 고차원적인 기능을 수행하는 분야를 Do..
2023.07.07 16:52 -
[Text-to-Music Generation] 음악 생성 그리고 AudioGPT
이번 글에서는 diffusion model을 활용한 음악생성 기술과 AudioGPT를 소개 드리고자 합니다. 최근들어 이미지 생성분야에서의 Diffusion model은 놀라운 성능을 보여주고 있는데요. 이제는 이미지 생성뿐만이 아니라 오디오 생성분야에서도 diffusion model을 활용하여 고음질 오디오를 생성하려는 연구가 활발히 진행되고 있습니다. 텍스트 프롬프트를 통해 텍스트를 입력받아 오디오 및 음악을 만들 수 있으며, 이러한 종류의 AI 모델은 일반적으로 "Text to Audio/Music" 또는 "Audio/Music Generation" 모델이라고도 합니다. 텍스트로 음악을 생성하는 Audio Generative Model 사실 이러한 ‘AI 생성 오디오(AI-generated aud..
2023.05.09 16:58 -
him; 비즈니스에 힘이 되다. powered by NHN Cloud AI 2023.05.09 15:39
-
[Text-to-Image Generation] ControlNet
AI가 만들어준 그림으로 미술대회에서 1등을 수상하다 혹시 여러분께서는 작년에 뉴스 기사를 읽거나 유튜브를 보던 중 아래 그림을 본 기억이 있으신가요? 이 신비한 그림은 2022년 8월 29일 미국 콜로라도 주립박람회 미술대회 디지털 아트 부문에서 1등을 차지한 그림입니다. 하지만 그림을 제출한 Jason Allen은 수상 발표를 통해 직접 그림을 그린 것이 아닌 텍스트로 이미지를 생성하는 미드저니(Midjourney) AI 모델로 그림을 생성했다고 밝히며 많은 논란이 있었습니다. 사실 완벽해보이는 위 그림은 단순히 미드저니 AI 모델을 한 번 사용한 것으로 만들어진 사진은 아닙니다. Jason Allen은 원하는 이미지를 생성하기 위한 적절한 텍스트 프롬프트를 찾는데 약 80시간 정도의 시간을 할애했다..
2023.04.04 11:12