Google Cloud facilita la colaboración de los científicos de datos

0

Recientemente fue anunciado el nuevo jefe del negocio de Google Cloud AI, llamado Andrew Moore. Esta unidad de esfuerza se caracteriza por hacer que las herramientas y técnicas de aprendizaje automático sean más accesibles y útiles para las empresas comunes. De esta forma queda justificado el reciente anuncio de nuevas y diversas herramientas por parte del equipo.

Google Cloud anunció recientemente el lanzamiento de Kubeflow Pipelines para fomentar la colaboración dentro de las empresas y democratizar aún más el acceso a la inteligencia artificial. Kubeflow Pipelines está disponible de forma gratuita y está siendo de código abierto.

Sin mencionar que también fue anunciado el lanzamiento de AI Hub, un marco modular para conectar diferentes componentes de aprendizaje automático.

Es probable que los esfuerzos para hacer que la IA sea más accesible definan el impacto de la tecnología. Sin mencionar que también serán muy importantes para el futuro de compañías como Google.

De hecho tal vez una de las grandes frustraciones con los científicos de datos es que los modelos que son desarrollados no siempre han tenido alguna aplicabilidad, y muchos se lo atribuyen a la falta de colaboración con los ingenieros y desarrolladores de software incluso dentro de una organización.

Kubeflow Pipelines


El director senior de gestión de productos de inteligencia artificial y aprendizaje automático de Google Cloud, Rajen Sheth, expresó que está de acuerdo con las estimaciones de que solo hay unos pocos miles de ingenieros de aprendizaje automático en el mundo con la capacidad de llevar el aprendizaje profundo del concepto a la producción, pero hay millones de científicos de datos y decenas de millones de desarrolladores.

De esta forma Sheth establece que se encuentra dentro de sus planes introducir mecanismos que permitan que los modelos pasen de los científicos de datos a otros de una forma sencilla para que las aplicaciones puedan desarrollarse, básicamente buscan que esta herramientas le permita a los científicos maximizar su trabajo.

Kubeflow Pipelines fue diseñado para hacer frente a esa brecha, capacitando a más científicos y desarrolladores de datos y ayudando a las empresas a superar los obstáculos para convertirse en las primeras empresas de inteligencia artificial.

“Uno de los mayores problemas que estamos viendo en la actualidad es que las compañías están tratando de crear equipos de científicos de datos, pero es un recurso tan escaso que, a menos que se utilice bien, comienza a desperdiciarse”, enfatizó Sheth. “Una observación que hemos visto es que, probablemente en más del 60 por ciento de los casos, los modelos nunca se implementan en producción en este momento. Así que estamos construyendo una serie de cosas para ayudar a curar eso”.

Pipelines es una capa componible, por lo que diferentes partes del viaje de aprendizaje automático se pueden unir como Legos, dijo Sheth.

Lo interesante de este enfoque es que permite a diferentes miembros de un equipo hacer cosas como etiquetar datos, convertir esos datos en características y validar datos. Sin mencionar que también puede ser útil para probar varias iteraciones y reemplazar un modelo o enfoque si se encuentra uno mejor.

“Pueden simplemente intercambiar el nuevo modelo, mantener el resto del conducto en su lugar y luego ver: ‘¿Ese nuevo modelo ayuda significativamente a la producción?’ Así que permite una experimentación rápida de una forma mucho mejor”, expresó. “Lo que estamos haciendo con Pipelines, puede comenzar a involucrar a los desarrolladores, puede comenzar a involucrar a analistas de negocios, puede comenzar a involucrar a los usuarios finales de manera que puedan formar parte de este equipo que puede construir un Pipeline”.

Cabe mencionar que Kubeflow es un proyecto de código abierto de Google lanzado a principios de este año para aprendizaje automático con contenedores KubernetesEl uso de Kubernetes permitirá a las empresas ser flexibles y evitar tener que comprometerse completamente con la capacitación de modelos de inteligencia artificial con datos y marcos locales o modelos de capacitación en la nube.

Kubeflow Pipelines utiliza los archivos de TensorFlow Extended (TFX), que fueron usados internamente en Google para desarrollar componentes de aprendizaje automático.

AI Hub


Por otro lado como se mencionó anteriormente, también se lanzó hoy en alpha el AI Hub, que como su nombre lo indica, es un lugar central donde los científicos de datos pueden buscar diferentes tipos de contenido de ML. Además cabe mencionar que la plataforma se basa en el módulo de aprendizaje automático TensorFlow Hub.

AI Hub está diseñado para ser una ventanilla única para personas interesadas en capacitar o implementar modelos relacionados a la inteligencia artificial.

Además de proporcionar capacitación, AI Hub se completará con recursos desarrollados por Google Cloud AI, Google Research y otros equipos de la compañía, como las incorporaciones populares de TensorFlow y el contenido de Kaggle, lo que permitirá a los científicos aprovechar la experiencia, investigación y desarrollo previo; es una comunidad de más de 2 millones de científicos de datos.

No obstante, Google quería que la plataforma fuera más que una biblioteca pública, también lo ve como un ligar donde los equipos pueden compartir información en privado dentro de sus organizaciones, dándole un doble propósito.

“Eventualmente queremos que AI Hub sea un lugar donde los terceros también puedan compartir información y convertirla más en un mercado con el tiempo”, manifestó Sheth. “Lo que estamos descubriendo es que la comunidad podría resolver los problemas de muchos de nuestros clientes”.

Inicialmente, AI Hub estará disponible para aproximadamente 100 socios comerciales en Alpha a partir de hoy con algunos componentes iniciales de Google.

Al igual que Kubeflow Pipelines, AI Hub también pretende educar a las fuerzas de trabajo para derribar las barreras entre los equipos dentro de las empresas con el propósito de que puedan hacer más valioso el trabajo de los desarrolladores, los científicos de datos y los ingenieros de ML.

Esta iniciativa forma parte de un conjunto mayor, donde una gran cantidad de empresas se han dado cuenta que es necesario generar y apoyar un proceso de alfabetización en la inteligencia artificial y las tecnologías similares. Esto se debe a que se reconoce la importancia que tendrá este tipo de tecnología dentro de las empresas, y para que estas puedan implementarla dentro de su estrategia requieren de capital humano capacitado en el área; el cual en este momento escasea.

“Creo que el verdadero gran desafío es que para convertirse en una empresa que utiliza la inteligencia artificial en primer lugar, todos deben tener conocimientos sobre la tecnología, desde un gerente de producto que piensa en el problema hasta un desarrollador, un científico de datos y los equipos de producción. Y una vez que tenga eso, puede comenzar a incorporar la IA en casi cualquier problema comercial, y ahí es donde estamos ahora “, dijo Sheth.

“Casi todos los productos de Google utilizan la inteligencia artificial de forma interesante, y nos damos cuenta de que puede resolver cada vez más problemas para nosotros, y esperamos que esto también pueda ayudar a fomentar esa cultura en otras empresas”.

Google también anunció el lanzamiento de la versión beta de tres nuevas funciones en la interfaz de programación de la aplicación Cloud Video de Google, que se utiliza para buscar y comprender el contenido de los videos.

Dejar respuesta

Please enter your comment!
Please enter your name here

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.