La carrera de Machine Learning es realmente una carrera de Data

Pedro Luis Martín Olivares – Las organizaciones que esperan hacer de la Inteligencia Artificial un elemento diferenciador deben basarse en conjuntos de datos alternativos, que pueden tener que crear ellos mismos.

El aprendizaje automático, o la inteligencia artificial, si lo prefiere, ya se está convirtiendo en un producto básico. Las compañías que compiten para definir e implementar simultáneamente el aprendizaje automático están descubriendo, para su sorpresa, que la implementación de los algoritmos utilizados para hacer que las máquinas sean inteligentes respecto a un conjunto de datos o un problema es la parte fácil. Existe una sólida cohorte de soluciones plug-and-play para lograr el pesado levantamiento programático, desde el marco de aprendizaje de código abierto de la máquina de TensorFlow de Google hasta Azure Machine Learning de Microsoft y SageMaker de Amazon.

Sin embargo, lo que no se está convirtiendo en materialización son los datos, ya que estos representan el diferenciador clave en la carrera de aprendizaje automático, dado que los buenos datos son infrecuentes.

Datos útiles: valiosos y raros

Los datos se están convirtiendo en un elemento diferenciador porque muchas empresas no tienen los datos que necesitan. Aunque las empresas se han medido de forma sistemática durante décadas utilizando principios de contabilidad generalmente aceptados, esta medida se ha centrado durante mucho tiempo en los activos físicos y financieros: cosas y dinero. Incluso en 2013 se otorgó un Premio Nobel a la fijación de precios de activos de capital, lo que refuerza estas prioridades bien establecidas.

Pero las compañías más valiosas de hoy en día se dedican al comercio de software y redes, no solo a bienes físicos y activos de capital. En los últimos 40 años, el enfoque de los activos se ha desviado completamente, ya que el mercado estaba dominado por un 83% de activos tangibles en 1975 y luego un 84% de activos intangibles en 2015. En lugar de fabricar cafés y vender lavadoras, los gigantes corporativos de hoy ofrecen aplicaciones y conectan personas. Este cambio ha creado una discrepancia drástica entre lo que medimos y lo que realmente impulsa el valor.

El resultado es que los datos útiles son problemáticamente raros. Existe una brecha creciente entre el mercado y los valores contables. Debido a esta brecha, las compañías están compitiendo para aplicar el aprendizaje automático a decisiones comerciales importantes, incluso reemplazando a algunos de sus consultores costosos, solo para darse cuenta de que los datos que necesitan ni siquiera existen todavía. En esencia, se les pide a los nuevos y sofisticados sistemas de inteligencia artificial que apliquen nuevas técnicas al mismo material antiguo.

Al igual que las personas, un sistema de aprendizaje automático no será inteligente en ningún tema hasta que no se haya enseñado. Las máquinas necesitan muchos más datos que los humanos para ser inteligentes, aunque, sin embargo, sí leen esos datos mucho más rápido. Por lo tanto, si bien hay una carrera de armamentos visible a medida que las empresas incorporan programadores de aprendizaje automático y dan inicio a iniciativas de IA, también hay una carrera de pánico tras bambalinas para obtener datos nuevos y diferentes.

En finanzas, por ejemplo, los datos alternativos van más allá de los informes tradicionales de la Comisión de Bolsa y Valores y las presentaciones de los inversionistas que influyen en las decisiones de inversión. Los datos alternativos, como el sentimiento de las redes sociales o el número de patentes otorgadas, son esenciales por dos razones importantes. Primero, los datos tradicionales se centran en los activos tradicionales, y eso no es lo suficientemente expansivo en la era de los activos intangibles. Segundo, no hay razón para molestarse en usar el aprendizaje automático para estudiar los mismos conjuntos de datos que están analizando todos los demás en el mercado. Todos los interesados ya han intentado correlacionar las tendencias de la industria, los márgenes de ganancias, las tasas de crecimiento, las ganancias antes de los intereses y los impuestos, la rotación de activos y el rendimiento de los activos, junto con las más de 1,000 otras variables comúnmente reportadas con el retorno de los accionistas.

Buscar conexiones entre los mismos conjuntos de material en que todos los demás trabajan, no va a ayudar a las empresas a ganar. En cambio, las organizaciones que quieran usar la Inteligencia Artificial como un diferenciador tendrán que encontrar relaciones entre los nuevos conjuntos de datos, conjuntos de datos que deben crearse para medir los activos intangibles.

La creación de datos es más compleja que simplemente agregar información de puntos de venta o de clientes y volcarlos en una base de datos: la mayoría de las organizaciones creen erróneamente que una ruta conveniente implica recopilar cada fragmento de datos posibles y analizarlos cuidadosamente, con la esperanza de encontrar un atisbo de información “insight”, entendiendo “insight” como la característica esquiva que predice o clasifica algo que importa por su relevancia.

Si bien el aprendizaje automático ocasionalmente puede sorprendernos con un destello de excepcional brillo que nadie aún tiene que descubrir, la tecnología no es capaz de proporcionar estas ideas con coherencia. Esto no significa que la herramienta esté equivocada, significa que tenemos que aplicarlo sabiamente. Esto es más fácil decirlo que hacerlo: por ejemplo, en la investigación del mercado de datos alternativos, se encuentra que más de la mitad de los nuevos proveedores de datos aún se centran en la medición de activos físicos y financieros.

El paso que muchas organizaciones omiten es crear una hipótesis sobre lo que importa. Donde el aprendizaje automático realmente sobresale es tener una percepción que tienen los humanos (una basada en reglas generales, percepciones amplias o relaciones poco entendidas) y desarrollar un método más rápido, mejor comprendido, más escalable (y menos propenso a errores) para aplicar la comprensión. .

Para utilizar el aprendizaje automático de esta manera, no se alimenta al sistema con todos los puntos de datos conocidos en el campo relacionado. Usted lo alimenta con un conjunto de conocimientos cuidadosamente curados, con la esperanza de que pueda aprender, y quizás ampliar, al margen, el conocimiento que las personas ya tienen.

El aprendizaje automático perspicaz proviene de diferentes datos

Todo esto tiene tres implicaciones específicas para las empresas que desean crear aplicaciones de aprendizaje automático impactantes y valiosas:

Los datos diferenciados son clave para un juego de Inteligencia Artificial exitoso. No descubrirá nada nuevo trabajando con los mismos datos que tienen sus competidores. Mire internamente e identifique lo que su organización sabe y comprende de manera única, y cree un conjunto de datos distintivos utilizando esos conocimientos. Las aplicaciones de aprendizaje automático requieren una gran cantidad de puntos de datos, pero esto no significa que el modelo deba considerar una amplia gama de características. Enfoca tus esfuerzos de datos donde tu organización ya está diferenciada.
Los datos significativos son mejores que los datos completos. Es posible que posea datos ricos y detallados sobre un tema que simplemente no es muy útil. Si su compañía no usaría esa información para ayudar a informar la toma de decisiones sobre una base ad hoc, entonces esos datos probablemente no serán valiosos desde una perspectiva de aprendizaje automático. Un arquitecto experto en aprendizaje automático le hará preguntas difíciles sobre qué campos son realmente importantes, y cómo esos campos probablemente serán importantes para su aplicación de los conocimientos que obtenga. Si estas preguntas son difíciles de responder, entonces no ha pensado lo suficiente como para producir valor práctico.
Lo que sabes debe ser el punto de partida. Las empresas que utilizan mejor el aprendizaje automático comienzan con una visión única de lo que más les importa para tomar decisiones importantes. Esto les guía sobre qué datos acumular, así como qué tecnologías utilizar. Un lugar fácil para comenzar es escalar y hacer crecer un conocimiento que su equipo ya tiene y que podría generar más valor para la organización.

Está claro que el software se ha comido el mundo (una frase acuñada por el empresario de software Marc Andreessen). ¡Pero todavía tiene hambre! El software necesita una dieta constante de nuevos datos combinados con nuevas tecnologías para continuar agregando valor.

No querrá quedarse atrás por este cambio de información, máquinas y datos alternativos. Comience a buscar internamente para identificar su perspectiva única y los datos valiosos y alternativos que podría y debería producir. Es desde esos pasos que descubrirá las ideas relacionadas para mantener a su organización competitiva.

Sabías que puedes leer esta artículo y otros en Telegram

Pedro Luis Martín Olivares
Economía y Finanzas

La carrera de Machine Learning es realmente una carrera de Data

Pedro Luis Martín Olivares – Las organizaciones que esperan hacer de la Inteligencia Artificial un elemento diferenciador deben basarse en conjuntos de datos alternativos, que pueden tener que crear ellos mismos.

Datos útiles: valiosos y raros

El aprendizaje automático perspicaz proviene de diferentes datos

Sabías que puedes leer esta artículo y otros en Telegram

Sé el primero en comentar en «La carrera de Machine Learning es realmente una carrera de Data»

Deja un comentario Cancelar la respuesta