Datasaur를 사용하면 일련의 레이블에서 자동으로 모델을 구축할 수 있습니다.
사람들이 ChatGPT 및 생성 AI에 대해 이야기하기 오래 전에 Datasaur와 같은 회사는 기계 학습 모델 구축의 기본 사항을 다루고 모델 학습을 위한 레이블 지정을 도왔습니다. AI가 등장하면서 이런 능력은 더욱 중요해졌다.
데이터 과학 전문가 없이 더 많은 회사에 모델 구축을 제공하기 위해 Datasaur는 라벨 데이터에서 직접 모델을 생성하는 기능을 발표하여 훨씬 덜 기술적인 청중도 모델 생성에 접근할 수 있도록 했습니다. 또한 지난 12월 마감된 400만 달러의 종자 확장을 발표했습니다.
회사 설립자인 Ivan Lee는 최근 AI에 대한 관심이 급증하면서 회사에 큰 도움이 되었으며 실제로 스타트업의 전략에 큰 도움이 되었다고 말했습니다. Lee는 TechCrunch에 "Datasaur가 항상 노력해 온 것은 LLM이든 전통적인 NER 모델이든 감정 분석이든 모델에 공급해야 하는 훈련 데이터를 수집할 수 있는 최고의 장소입니다"라고 말했습니다.
“우리는 기술적인 지식이 없는 사용자가 데이터에 라벨을 붙일 수 있는 최고의 인터페이스입니다.”라고 그는 말했습니다.
LLM의 등장은 AI가 비즈니스 맥락에서 어떻게 도움이 될 수 있는지에 대한 전반적인 인식을 높이는 데 도움이 되지만, 그는 대부분의 기업이 여전히 탐색 단계에 있으며 모델을 구축하려면 여전히 Datasaur와 같은 제품이 필요하다고 말합니다. Lee는 처음부터 자신의 목표 중 하나가 특히 자연어 처리를 중심으로 AI를 민주화하는 것이었고, 새로운 모델 구축 기능을 통해 전문 지식이 없는 기업도 포함하여 더 많은 기업이 AI를 사용할 수 있게 될 것이라고 말했습니다.
"그리고 이 기능은 데이터 과학자나 엔지니어가 없는 팀이 적합하다고 생각하는 대로 이 데이터를 마크업하고 레이블을 지정하고 자동으로 모델을 훈련할 수 있기 때문에 제가 특히 기대하는 기능입니다."라고 Lee는 말했습니다. .
Lee는 이를 데이터 과학자의 초기 목표 시장을 넘어서는 방법으로 봅니다. "이제 우리는 데이터 엔지니어링 배경이 없더라도 [훈련 데이터를 기반으로] NLP 모델을 구축할 수 있는 건설 회사, 법률 회사, 마케팅 회사를 개방할 것입니다."
그는 자신이 취한 벤처 투자 금액을 제한할 수 있었다고 말합니다. 이전 시드는 2020년에 390만 달러에 불과했습니다. 그의 엔지니어링 팀은 대부분 인도네시아에 있으며 채용을 기대하고 있지만 효율적인 방식으로 회사를 운영하는 데 자부심을 갖고 있습니다.
“나의 철학은 항상 수익성, 확장 가능한 방식으로 성장하는 것, 어떤 대가를 치르더라도 결코 성장하지 않는 것이었습니다.”라고 Lee는 말했습니다. 이는 그가 모든 고용과 그것이 비즈니스에 미칠 영향을 고려한다는 것을 의미합니다.
원격의 다문화 인력을 보유함으로써 직원들은 서로에게서 배울 수 있으며 이는 본질적으로 회사에 다양성을 가져옵니다. “미국과 인도네시아의 직장 문화에는 상당한 차이가 있습니다. 그래서 한 가지는 우리가 두 세계의 장점을 모두 포착하기 위해 의도적으로 노력해야 한다는 것입니다.”라고 그는 말했습니다. 이는 인도네시아 동료들이 관리자가 말하는 것에 대해 목소리를 높이거나 반발하도록 격려하는 것을 의미할 수 있는데, 이는 문화적으로 그들이 싫어하는 일입니다. “우리는 이를 장려하기 위해 매우 적극적으로 노력해 왔습니다.”라고 그는 말했습니다.
그러나 그는 동료에 대한 존중과 팀을 최우선으로 생각하는 문화 등 아시아에서 일이 어떻게 운영되는지에 대해 미국 직원들이 배울 수 있는 것이 많다고 말하며, 팀이 이러한 문화적 차이를 헤쳐 나갈 수 있도록 도와야 한다고 말했습니다.
400만 달러의 투자는 HNVR, Gold House Ventures 및 TenOneTen이 참여한 Initialized Capital이 주도했습니다. 회사는 총 790만 달러를 모금했습니다.