Galileo taucht aus der Tarnung auf, um die Entwicklung von KI-Modellen zu optimieren – TechCrunch

Galileo taucht aus der Tarnung auf, um die Entwicklung von KI-Modellen zu optimieren – BesteFuhrer

Da der Einsatz von KI im gesamten Unternehmen immer üblicher wird, steigt die Nachfrage nach Produkten, die es einfacher machen kritische KI-Fehler zu untersuchen, zu entdecken und zu beheben nimmt zu. Schließlich ist KI kostspielig – Gartner prognostizierte 2021, dass ein Drittel der Technologieanbieter bis 2023 1 Million US-Dollar oder mehr in KI investieren würde – und das Debuggen eines Algorithmus, der schief gelaufen ist, droht das Entwicklungsbudget aufzublähen. Ein separater Gartner-Bericht ergab, dass nur 53 % der Projekte es vom Prototypen bis zur Produktion schaffen, was vermutlich teilweise auf Fehler zurückzuführen ist – ein erheblicher Verlust, wenn man die Ausgaben zusammenzählt.

Genug von der hohen Ausfallrate – und der Tatsache, dass geringfügige (wenn auch wichtige) Datenvorbereitungsaufgaben wie das Laden und Bereinigen von Daten immer noch den Großteil der Zeit der Datenwissenschaftler in Anspruch nehmen – haben Vikram Chatterji, Atindriyo Sanyal und Yash Sheth Galileo, a Dienst, der als kollaboratives Aufzeichnungssystem für die Entwicklung von KI-Modellen dienen soll. Galileo überwacht die KI-Entwicklungsprozesse und nutzt statistische Algorithmen, um potenzielle Punkte für Systemausfälle zu lokalisieren.

„Es gab also keine speziell entwickelten Datentools für maschinelles Lernen auf dem Markt [we] startete Galileo mit dem Aufbau des Tooling-Stacks für maschinelles Lernen, beginnend mit a [specialization in] unstrukturierte Daten“, teilte Chatterji BesteFuhrer per E-Mail mit. „[The service] hilft Teams für maschinelles Lernen, ihre Datensätze zu verbessern … indem es kritische Kohorten von Daten aufdeckt, die möglicherweise unterrepräsentiert oder fehlerhaft sind, und gleichzeitig eine Rundumlösung ist, um Data Scientists zu ermutigen, Datenänderungen in der Produktion proaktiv zu verfolgen, und verhindert, dass Fehler und Lücken in ihren Modellen durchsickern in die reale Welt.“

Chatterji hat einen Hintergrund in Data Science, nachdem er drei Jahre lang bei Google als Produktmanager im Android-Team gearbeitet hat. Sanyal war Senior Software Engineer bei Apple und konzentrierte sich hauptsächlich auf Siri-bezogene Produkte, bevor er Engineering Lead im KI-Team von Uber wurde. Was Sheth betrifft, so arbeitete er auch bei Google als angestellter Softwareentwickler und verwaltete die Google Speech Recognizer-Plattform.

Mit Galileo, das heute mit einer Startfinanzierung von 5,1 Millionen US-Dollar aus der Tarnung hervorgegangen ist, machten sich Chatterji, Sanyal und Sheth daran, ein Produkt zu entwickeln, das über den gesamten KI-Workflow – von der Vorentwicklung bis zur Postproduktion – sowie Datenmodalitäten wie skalieren kann Text, Sprache und Vision. Galileo ist in einer privaten Beta-Version verfügbar und für den Einsatz in einer lokalen Umgebung konzipiert. Galileo zielt darauf ab, Pipelines teamübergreifend zu systematisieren, indem „Auto-Logger“ und Algorithmen verwendet werden, die systembrechende Probleme hervorheben.

Das Auffinden dieser Probleme ist oft ein großer Schmerzpunkt für Data Scientists. Laut einer kürzlich durchgeführten Umfrage (von der MLOps Community) sagen 84,3 % der Datenwissenschaftler und Ingenieure für maschinelles Lernen, dass die Zeit, die zum Erkennen und Diagnostizieren von Problemen mit einem Modell erforderlich ist, ein Problem für ihre Teams darstellt, während mehr als jeder Vierte (26,2 %) dies zugibt dass sie eine Woche oder länger brauchen, um Probleme zu erkennen und zu beheben.

„Die Diskussion über maschinelles Lernen innerhalb des Unternehmens hat sich von ‚Wofür verwende ich das?’ zu ‚Wie kann ich meine Workflows für maschinelles Lernen schneller, besser und billiger machen?’“, sagte Chatterji. „Galileo … erzwingt die notwendige Strenge und die proaktive Anwendung forschungsgestützter Techniken bei jedem Schritt der Produktion von Modellen für maschinelles Lernen … [It] führt zu einer erheblichen Verbesserung der Art und Weise, wie Teams mit der chaotischen, nervtötenden Aufgabe der Verbesserung ihrer maschinellen Lerndatensätze umgehen.“

Galileo passt in die aufkommende Praxis von MLOps, die maschinelles Lernen, DevOps und Data Engineering kombiniert, um KI-Modelle in Produktionsumgebungen bereitzustellen und zu warten. Der Markt für MLOps-Dienste könnte einer Schätzung zufolge bis 2025 4 Milliarden US-Dollar erreichen und umfasst Startups wie Databricks, DataRobot, Algorithmia und etablierte Unternehmen wie Google Cloud und Amazon Web Services.

Während das Interesse der Anleger an MLOps zunimmt, führt Bargeld nicht unbedingt zum Erfolg. Selbst die besten MLOps-Plattformen von heute können nicht alle gängigen Probleme im Zusammenhang mit KI-Workflows lösen, insbesondere wenn Führungskräfte nicht in der Lage sind, die Kapitalrendite dieser Initiativen zu quantifizieren. Die Umfrage der MLOps Community ergab, dass es für über 80 % der Praktiker des maschinellen Lernens „zumindest manchmal“ ein Problem bleibt, Stakeholder zu überzeugen, wenn ein neues Modell besser ist.

Chatterji verweist auf die Investition von Kaggle-CEO Anthony Goldbloom in Galileo – Goldbloom leitete die Seed-Runde gemeinsam mit The Factory – als Zeichen für die Differenzierung des Unternehmens. Chatterji sagt, dass Galileo derzeit „Dutzende“ zahlender Kunden hat, die von Fortune-500-Unternehmen bis hin zu Startups in der Frühphase reichen – Einnahmen, die Galileo nutzen will, um die Größe seines 14-köpfigen Teams bis Ende des Jahres zu verdreifachen.

„Galileo hat sich darauf konzentriert, die ansonsten mühsame Aufgabe der Datenprüfung durch maschinelles Lernen umzukehren, um sie einfach zu machen und schnell intelligente Dateneinblicke zu liefern“, sagte Chatterji. „Der Benutzer muss nur ein paar Codezeilen hinzufügen.“

Bis heute hat Galileo insgesamt 5,5 Millionen US-Dollar an Risikokapital aufgebracht.

Leave a Comment

Your email address will not be published.