Raul Barral Tamayo's Blog

Frases Llenas

Alquimia de Juan Manuel López Zafra y Ricardo A. Queralt Sánchez de las Matas – Apuntes

Posted by Raul Barral Tamayo en jueves, 25 de marzo, 2021


© Ricardo Antonio Queralt Sánchez de las Matas, 2019.
© Juan Manuel López-Zafra, 2019.
Editorial: Deusto.

Los alquimistas antiguos intentaron una y otra vez convertir el plomo en oro. Nunca lo consiguieron. Los alquimistas de nuestro tiempo, los científicos de datos, sí han logrado su objetivo: convertir los datos en una herramienta que permite tomar buenas decisiones y, con ellas, obtener un beneficio.

En España nos falta “cultura del dato”. Para su propia desgracia, la mayoría de las empresas suele ignorar cualquier aspecto que gire en torno a él. Sin embargo, hay grandes ejemplos de organizaciones pioneras que entienden que éste es esencial para su transformación y han empezado a integrar a analistas y científicos de datos en sus equipos. Airbnb, Amazon o incluso los equipos de comunicación de Obama y Trump son algunos ejemplos.

Tal y como se explica en este libro, analizando los datos y tomándolos como guía para tomar mejores decisiones y ampliar el conocimiento sobre sus clientes actuales y potenciales han conseguido mejorar sus procesos.

Alquimia profundiza en los aspectos empresariales de los datos estadísticos, éticos y políticos, legales y tecnológicos, y abre la puerta al nuevo avatar de nuestra especie: el Homo Algorithmus.

Juan Manuel López Zafra es Doctor en Economía y actuario. Es profesor en el CUNEF, donde codirige el Máster en Data Science para Finanzas y el Programa Ejecutivo de Data Science y Transformación Digital. Está especializado en el tratamiento de datos y su posterior análisis en los sectores financiero, asegurador, turístico y del automóvil, así como en la aplicación de técnicas de ciencia de datos a las ciencias sociales. En 2007 fundó Statpro 2000 Clima SL, una empresa de consultoría de análisis de datos. Es autor de Retorno al Patrón Oro (Deusto, 2014) y colabora con diversos medios de comunicación, tales como El Confidencial y Capital Radio.

Ricardo A. Queralt es Doctor en Economía Cuantitativa y profesor de métodos cuantitativos. En la actualidad imparte docencia en el CUNEF, donde codirige con López Zafra el Máster en Data Science para Finanzas y el Programa Ejecutivo de Data Science y Transformación Digital. Fuera de la docencia y la investigación, su carrera se ha centrado en la aplicación de métodos cuantitativos a la empresa. Ha sido miembro del Comité Consultivo de Protección al Inversor e Intermediarios de la Autoridad Europea de Valores y Mercados.

Algunas de las cosillas que aprendí leyendo este libro que no tienen porque ser ni ciertas ni falsas ni todo lo contrario:

  • Nunca habrá datos para expresar los sentimientos.
  • Los datos son el petróleo del siglo XXI.
  • En muchas ocasiones no se logra el resultado esperado por las diferencias culturales entre el equipo directivo y el equipo de científicos de datos. Esas diferencias provienen de la distinta forma de abordar los problemas, y de la absoluta novedad que supone la introducción del método científico en la gestión del cambio.
  • Lo primero que tenemos que entender es que no, que los datos no son petróleo. Se puede tener mucho petróleo y, desgraciadamente no ser rico. Los datos se asemejan mucho más a un metal que tras un proceso de transformación, transmutan en oro.
  • Podemos entender como una forma de alquimia el proceso de transformación del dato, primero en información, luego en conocimiento. La gran ventaja, hoy, es que la alquimia actual, la ciencia de datos, está a menos de tres clics de distancia de cualquiera que quiera formarse en ella.
  • Todo empieza y todo acaba con la estadística, pues todo tiene que ver con la identificación y la cuantificación de la información en un entorno de incertidumbre.
  • Fundamentalmente, nos referimos al lenguaje R, el más empleado en análisis y modelado de datos. Gracias a R, una derivación del lenguaje de programación S, todo el mundo tiene acceso a la última innovación en cualquier disciplina científica relacionada con el modelado de datos, a coste cero, en su propio ordenador personal. A finales de abril de 2019, en el repositorio oficial del programa, el CRAN, constaban más de 14.400 bibliotecas o macros específicas para resolver prácticamente cualquier problema que requiera un análisis de datos.
  • Junto con Python, el conocido lenguaje creado a finales de los ochenta por Guido van Rossum, mucho más orientado a la producción que el anterior, conforman la base de programación que hace de la ciencia de datos el paradigma de la investigación actual.
  • Al reaseguro se lo suele definir como “el seguro de las aseguradoras”. En parte eso es así, pues efectivamente, las compañías de seguros ceden parte de su responsabilidad contraída a las reaseguradoras a cambio también de una prima, el precio del riesgo. Estamos hablando de empresas con un músculo financiero espectacular. En un sector en el que las castástrofes tienen un impacto directo, la gestión del riesgo se presenta como un elemento clave.
  • Los métodos de la ciencia de datos están cambiando la práctica reaseguradora. El sector reasegurador se beneficia directamente de la precisión, adaptando sus tarifas al riesgo cubierto y proporcionando precios más competitivos a sus clientes, las compañías aseguradoras, que, a su vez, los trasladan en mejores condiciones a empresas y particulares.
  • Todo algoritmo de machine learning requiere un conjunto de datos sobre el que entrenarlo y otro, separado del anterior, sobre el que contrastar su validez.
  • Permite conocer causas que hasta el momento eran supuestas, cuando no completamente desconocidas.
  • La evolución natural de los algoritmos de machine learning es hacia los de inteligencia artificial, que, además de aprender, son capaces de reaccionar, permitiendo decisiones automáticas.
  • La historia de Amazon es la historia de una empresa volcada en el cliente. En esa aproximación al negocio, la gestión de los datos ha sido clave.
  • “Lo mejor de las decisiones basadas en hechos es que invalidan la jerarquía”, es una de esas frases que se atribuyen a Bezos.
  • Amazon no puede entenderse sin la aplicación desde sus inicios de los métodos y técnicas de la ciencia de datos.
  • Lo importante de este proceso es cómo el dato, y no la intuición, guía las decisiones.
  • En la actualidad, el algoritmo de filtrado colaborativo de mayor crecimiento es el de categoría o one-class. Se basa fundamentalmente en la actividad del usuario, más que en sus valoraciones, a través de sus preferencias implícitas.
  • Otra de las características que distingue a los científicos de datos de los analistas de datos es su capacidad de construir modelos predictivos.
  • Cada vez más, las firmas de auditoría están incorporando técnicas de análisis de datos que permiten efectuar un seguimiento completo de la información en todas las fases del proceso, tratando al mismo tiempo de aquilatar los costes.
  • entrada original: https://raulbarraltamayo.wordpress.com/2021/03/25/alquimia-de-juan-manuel-lopez-zafra-y-ricardo-a-queralt-sanchez-de-las-matas/
  • Los aspectos que pueden ayudarnos a entender esa transición a la aportación de los datos son cuatro: la disponibilidad, la forma de medir la estrategia, la generación de informes y la operatividad.
  • En el caso de Francia, el artículo 33 de la ley de Reforma de la Justicia establece una sanción de hasta cinco años de prisión por evaluar, analizar, comparar o predecir las prácticas profesionales de los jueves; esto es, de sus sentencias.
  • Quizá las elecciones estadounidenses de 2012 y, sobre todo, las de 2016, con la (por casi todos inesperada) victoria de Donald Trump, son el mejor ejemplo de cómo una comunicación eficaz debe, hoy, utilizar las herramientas que la ciencia de datos pone a su disposición.
  • Gracias a las redes sociales, los consumidores tienen una voz con la que antes no contaban, obligando a las entidades a una cada vez mayor transparencia. La comunicación directa con los usuarios y clientes pasa a ser la norma.
  • La construcción de relaciones de auténtica confianza es otra ventaja competitiva. Los clientes de hoy demandan más, y se conforman menos con lo que se les ofrece. La ciencia de datos es capaz de proporcionar una mejor comprensión de los consumidores, una optimización de las redes y una reconducción de la eficiencia operativa.
  • Hoy día, toda nuestra actividad deja un rastro digital; esto significa que se pueden trazar todos los puntos con los que interactuamos.
  • Para la campaña de reelección de 2012, el equipo de Obama contó con una inversión de más de 1.000 millones de dólares en ciencia de datos.
  • Recordemos cómo, en la década de los años setenta, el miedo provenía del control de IBM sobre los ordenadores. Cómo ese miedo se trasladó, en los ochenta y noventa, a Microsoft. Y cómo, hoy, el miedo se traslada a los GAFA. La experiencia del mercado libre nos enseña que no hay posición de dominio que dure, no cien, treinta años.
  • Llegado 2012, Michal Kosinski presenta los resultados de su investigación: con menos de setenta likes de Facebook, podía predecir el color de la piel de las personas, su orientación sexual y, lo que resultará determinante, su sensibilidad política. Por supuesto, sus hábitos de vida, su religión, su inteligencia, todo ello era accesible a través de la combinación de likes, OCEAN y el algoritmo que desarrollaron. 150 likes permitían al algoritmo saber, de quien voluntariamente había cedido su intimidad, más que sus propios padres; 300 likes, más que su propia pareja.
  • Las técnicas de microtargeting que había desarrollado el equipo de Obama cuatro años antes. De cada perfil, obtienen entre 3.00 y 5.000 registros. Piensen en una matriz de Excel de 250 millones de filas con al menos 3.000 columnas. Ésa es la potencia de la ciencia de datos: convertir esos datos en información, y esa información en conocimiento.
  • Se trata de ofrecer al cliente lo que desea, cuando lo desea y al precio que lo desea. El producto, o el servicio, se construye entonces, adaptándolo a las necesidades reales.
  • El objetivo es determinar qué debo ofrecer a cada cliente, en cada etapa del proceso, para lograr su atención, para lograr que se informe, para lograr que nos tome en consideración, para que compre.
  • El entrenamiento supone que tenemos una muestra lo suficientemente representativa de situaciones pasadas en las que los clientes actuaron en un sentido o en otro. De esta manera, el algoritmo va creando, mediante sucesivas aproximaciones infinitamente rápidas, un modelo en el que va comparando las predicciones con el resultado real final. Existen diversas pruebas que permiten determinar cuándo el algoritmo debe parar su entrenamiento para evitar uno de los problemas más habituales, que es el del sobreajuste u overfitting.
  • La fijación de los precios es uno de los problemas fundamentales de cualquier negocio, más aún cuando el mercado es extremadamente competitivo y los márgenes son muy reducidos. Es el caso de las compañías aéreas low cost.
  • El equipo de Marcin Pilarczyk, responsable de Ryanair Labs Data & Analytics, analiza el consumo de todos los aviones en cada uno de los trayectos, buscando aquellos cuyo comportamiento excede un umbral de alerta determinado, denominados técnicamente outliers o valores atípicos.
  • El béisbol y el baloncesto son la cuna de la estadística aplicada al deporte.
  • De la importancia de los sistemas de análisis da cuenta el hecho de que los  tiros triples, con una tasa de acierto de sólo el 3%, eran más rentables que los lanzamientos de dos puntos, lo que animó a los entrenadores a exigir mayor cantidad de lanzamientos triples. Así, si en 2011-2012 el promedio de lanzamientos a canasta más allá de la línea de tres puntos fue de 18,4 por partido, en la temporada 2016-2017 se incrementaron un 46%, hasta los 27.
  • La capacidad de elaborar modelos que pronostican la posibilidad de lesión o agotamiento de cada jugador ha sido una de las claves para que la ciencia de datos se asentase, definitivamente, como uno de los pilares en la preparación de la temporada y de cada partido.
  • Por desgracia, muchas de esas aplicaciones que recogen millones de datos a diario carecen de la más mínima base científica para asesorar a los usuarios y utilizan los datos de forma distinta a la prevista.
  • Hay que ser conscientes de que la ciencia de datos no es una moda, sino el siguiente escalón en la evolución empresarial. Todas las organizaciones, de cualquier tamaño, de cualquier sector, sean mercantiles o sin ánimo de lucro, públicas o privadas, están abocadas a una transformación digital.
  • Es fundamental entender que el departamento de datos es transversal a toda la organización, y que debe dar servicio no sólo al comercial para generar mayores y mejores ventas, sino, en general, a todos aquellos que pueden requerir de información detallada de su propia actividad.
  • Es un error considerar que el área de datos (sea cual sea su nombre) es la proveedora de todas las necesidades de KPI, gráficos e indicadores del resto de las áreas.
  • Para que realmente el área de datos genere un valor añadido, deberá preocuparse de investigar las razones por las que el área de ventas está mejorando o está retrocediendo, y de proponer mejoras a partir de los datos existentes y de las proyecciones que se generen.
  • Las distintas áreas de la empresa deben superar las limitaciones de la hoja de cálculo y entrar, de lleno, en la exploración que permiten las nuevas herramientas de gestión y análisis de los datos, como Qlik, Tableau o Metabase.
  • La empresa debe valorar la creación de un data lake, el lago en el que confluyen todos los ríos de información disponibles, convenientemente organizados.
  • Las principales características que deben considerarse a la hora de construir el data lake son las siguientes: debe tener amplia capacidad analítica, debe permitir la interoperabilidad, debe permitir la continuidad del negocio, sin interrupciones, y, por supuesto, debe ser eficiente en coste.
  • Precisamente porque no podemos saber hoy qué datos vamos a necesitar mañana, es imprescindible que el data lake recoja esos datos de forma adecuada para su procesamiento en cuanto sean requeridos. Y esos datos deben salvaguardarse en su formato original, crudos, de manera de poder operar sobre ellos sin pérdida de su esencia original.
  • La gestión del dato no acaba con el data lake, ni mucho menos. Es donde empieza. Es esa primera decisión, la de su creación, la que pone de manifiesto un cambio cultural en el seno de la organización. En paralelo a la creación de este manantial en el que toda la información reposa, son necesarias distintas tareas que permitirán lograr el éxito de la organización data-driven.
  • No tendrán sentido las normas y los cambios estructurales en las empresas si no consideramos el pilar fundamental del cambio hacia una sociedad data-driven, hacia un mundo dirigido por los datos. Y ese pilar no es otro que el de la ética.
  • Se prevé que en 2020 todos los ciudadanos chinos estén clasificados de acuerdo con un “crédito social” que, a semejanza de los sistemas de calificación crediticia, asignará una puntuación a cada uno de ellos en virtud de sus cualidades como buenos ciudadanos. Esa puntuación conllevará la posibilidad de premios y de penalizaciones de acuerdo con las decisiones administrativas. Quienes tengan deudas disponen de un tono exclusivo de llamada entrante, que alerta a los demás de la presencia del deudor.
  • Estamos inmersos en la cuarta revolución industrial. Si la primera se caracterizó por la transformación de los procesos industriales, la segunda por la separación entre el ideólogo y el ejecutor, y la tercera por la incorporación del ordenador a los procesos productivos, la cuarta se caracteriza por la transformación del dato en conocimiento. Cada una ha tenido lapsos cada vez más breves de incorporación a la sociedad.
  • Es muy difícil vaticinar cuándo llegará la quinta, que será la de la incorporación definitiva de los procesos de inteligencia artificial a todos los sectores.
  • Por singularidad Ray Kurzweil define el momento en que el progreso científico y tecnológico, en particular en el área de la inteligencia artificial, llevará a las máquinas a ser más inteligentes que los seres humanos.
  • Por primera vez en la historia, la evolución humana no requerirá de mayor capacidad cerebral. La aparición del Homo algorithmus se caracterizará por desarrollar su inteligencia fuera de su propio cuerpo, en conexión con la nube.
  • Muchos científicos (Stephen Hawking y Elon Musk son quizá los más conocidos miembros del Future of Life Institute) muestran una enorme preocupación por las capacidades de la inteligencia artificial. Advierten que una inteligencia artificial desbordante, sin límites, supone una amenaza mayor que las armas nucleares.
  • Nosotros, pese a todo, somos optimistas. La inteligencia artificial mejorará las capacidades del ser humano. La acción humana siempre prevalece, y coincidimos con Harari en que “algo de libertad es mejor que ninguna”. Será ese deseo de libertad el que ponga los límites a nuestro desarrollo, y el que hará triunfar al Homo algorithmus.

Enlaces relacionados:

Otros libros relacionados:

raul

Una respuesta para “Alquimia de Juan Manuel López Zafra y Ricardo A. Queralt Sánchez de las Matas – Apuntes”

  1. […] Alquimia de Juan Manuel López Zafra y Ricardo A. Queralt Sánchez de las Matas. […]

    Me gusta

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios .

 
A %d blogueros les gusta esto: