인공지능(AI) 전문가 크라우드스웍(대표 김우승)은 기업의 특화 소형 언어 모델(sLM) ‘웍스원(WorksOne)’을 개발했다고 25일 밝혔다.
웍스원은 알리바바의 ‘큐원(Qwen)’ 모델을 사용했습니다. “국내 비즈니스 날씨를 가장 잘 이해할 수 있는 언어 모델”이라고 설명합니다.
9월부터 8개월 동안의 대규모 프로젝트를 진행한 결과, 우한 7주년을 계속하는 날에 공개적으로 나타났습니다.
클라우드드웍스는 현재 영어 대형 소형 언어 모델(LLM)의 발견을 발견했습니다. 영어는 당연히 국내 비즈니스를 제대로 이해해야 하지 않기 때문에 기업의 수요를 해소하기 위해 노력해야 합니다.
문제 해결을 위해 가장 공을 들이는 부분은 데이터입니다. 1만개에 고품질 데이터셋을 학습하고 기업이 선호하는 비즈니스 친화적인 답변을 제공하고자 합니다.
특히 가능성이 높은 데이터 구축을 위해 직접적으로 데이터 구축에 참여한다는 설명이다.
데이터셋은 금융별, 공개 기관, 공개 기관 등 기업 데이터의 특징을 분석하는 것부터 시작됩니다.
상업적인 상황에 대해, 문체, 보고 사실 등이 있다고 주장했습니다. 시중에서 종종 열려할 수 있는 원문 데이터에는 오류가 출력될 수 있어, 모델이 문맥을 잘못 이해하거나 소수의 특정 내용을 변환할 수 있습니다.
고급 데이터를 기반으로 하는 데이터, 비즈니스 언어를 활용하고 표현력, 문서 구조화 능력 등 자체 검증을 했다.
내부 내부 시스템과 케이스는 외부의 견고한 커팅으로 구성되어 있습니다. 워크스원은 외부 키(Key) 값과 구조를 선호하는 제이슨(JSON) 형식의 답변을 반환할 수 있습니다.
측면 레거시 시스템과의 통합 및 확장이 가능해 데이터 교환이나 능력력을 향상할 수도 있습니다.
자체 테스트 성능에서 챗GPT나 다른 모델보다 반사 성능을 중요하게 생각합니다. 존재하지 않는 항목에 로그인되어 있습니다.
“한 응답에 띄어쓰기 또는 오류가 발생하더라도 처리에 있어서 사용자를 소모하는 것이 현실적으로” “이니까 응답을 보내드릴 수 있는 것은 매우 중요합니다”라고 강조했습니다.
모델 성능 평가를 샘플 테스트를 진행했습니다. 사용자가 서로 다른 키 값을 설정해 응답을 JSON 형식으로 동시에 표시하면, 학파의 주요 문자를 목록으로 생성하여 표시를 선택할 수 있습니다.
그 결과 ‘GPT-3.5’는 데이터 해석, 오류, 띄어쓰기 오류 등의 오류가 발생하고, JSON 형식의 답변을 반환하지 않았습니다.
한국어 환경에서는 웍스원이 개별적으로 매우 큰 모델보다 월등한 결과를 맺고 구별됩니다.
스카이우드웍스가 LLM 사업에 집중하고 있습니다.
이해관계자는 “아직 초기 시장이기 때문에 예상을 언급하기만 하면, 기업들이 경제력이나 보안 때문에 파운데이션 모델을 실제로 사용하기는 어렵다는 사실”이라고 “sLM을 선호하는 만큼, 더 이상 요구하는 것은 계속되는 것”이라고 말합니다. 말했다.
중력이 있는 데이터를 한 문제 정의로, 데이터 구축 및 자산화를 시작으로 모델 구축, 또 독특한 개발, 데이터 및 모델 평가까지 풀스택 서비스를 충족하는 AI 시장 경쟁을 충분히 감당해야 합니다.
이미 여러 산업군에 LLM 건설 전문가를 자위로 쌓는 것은 마찬가지로, 기반으로 확장도 확장할 계획입니다.
이형주 크라우드웍스 CTO는 “비즈니스 및 문서 환경에 대한 이해도가 높은 전문가가 직접 만든 데이터로 학습 결과”라고 말합니다. “비즈니스 특화 모델로서 이러한 고품질 데이터로 학습한 모델은 업계에서 유일하다”고 말했습니다.
또 “앞에 AI 데이터부터 LLM까지 기업 혁신에 필요한 모든 것을 제공할 수 있다”고 말했습니다.
장세민 기자 [email protected]