No sos vos: son los datos (parte II)

No sos vos: son los datos (parte II)
18 septiembre, 2020 por Redacción La tinta

Por Walter Alini

En el capítulo anterior de esta novela, a partir de una frase de The Economist, del año 2017, que decía: «El recurso más valioso del mundo no es más el petróleo, sino los datos».

Intentamos establecer algunos conceptos básicos para entender de qué hablamos cuando hablamos de Ciencia de Datos y de Machine Learning Inteligencia Artificial, entre otros conceptos, y revisar cómo suele ser el proceso de obtención y entrenamiento de modelos (“el algoritmo”) a partir de estos datos.

Si no leiste la primera parte, no pasa nada, siempre habrá tiempo. Y considero más importante tu atención en esta parte II, en la que voy a intentar acercar cómo las organizaciones toman decisiones y hacen negocio con los datos.

Vamos a eso.

Haz conmigo lo que quieras,
que por supuesto te perdonaría.
Mi locura no tiene fronteras:
eres dueña de la vida mía.
Cambia todo en un instante
que, por supuesto, también te lo creo.
Miente y trata de olvidarme
y que me importa nada: si yo así te quiero.

Qué clara la tenía Axel (?). Más aún: “Amada mía”, así el nombre de la canción que contiene esta letra, está en el disco “La clave para conquistarte”. Todo cuadra. Qué vanguardista, hablar de Ciencia de Datos en el año 1999. Si seguimos la línea, también Axel nos inspira en lo que está pasando y en lo que se vendrá: delitos contra la integridad, abusos y denuncias que quedan en la nada por falta de testigos. Intentaremos volver a esto en la siguiente entrega.

Los datos pueden ser parte de la toma de decisiones y, por eso, a las empresas les gustan mucho, de la misma forma que les gustan mucho a los que quieren nutrir sus decisiones para intentar tomarlas con dignidad. A los buenos gobiernos también les gustan: es esencial la política basada en evidencia para hacer uso de los recursos de la sociedad.

Lo que cambió en los últimos años es el poder de escala. El almacenero le vende manteca Primer Premio a doña Rosa, porque dice que es la mejor para los fideos con manteca. Doña Rosa siempre habla con don Cosme y están meta charlar por horas en la vereda del almacén. El almacenero le pregunta a don Cosme si probó la manteca Primer Premio y se la ofrece para aumentar sus ventas. Si tiene éxito, es posible que la semana que viene le quiera encajar el paquete de fideos Don Vicente, que también lleva doña Rosa. Y también a doña Rosa intentará venderle un atado de puchos Parisiennes, de los que don Cosme compra a razón de dos por semana.

Lo mismo quieren las empresas: hacer crecer sus negocios, invertir mejor el dinero, perder menos aceite (o manteca), minimizar fricción. Mejores resultados y costos más eficientes, digamos. Y para eso, más conocen a sus (potenciales) clientes, más oportunidades tendrán para hacerlo. Y desde que tenemos a nuestro smartphone con nosotros (desde antes también, pero esto marcó un quiebre importante), tenemos también una máquina de generar datos que se pueden asociar a nosotros: dónde estamos, con quiénes estamos, qué buscamos, qué trayectos hacemos, dónde compramos, qué tanto nos movemos, cómo nos movemos. El almacenero estaría encantado de saber que don Cosme compra Playboy a la vuelta del almacén desde hace más de 20 años, porque seguramente podría ofrecerle unos VHS que no expone a todos y cuya circulación viene en decadencia en los últimos años.

En general, estos datos no están necesariamente personalizados. Quiero decir, a las empresas no les interesa que don Cosme compre Playboy, le interesa que un tipo de ese lugar, que vive en ese barrio, que se comporta de esa forma, compra Playboy. Para los datos, nosotros también somos uno de ellos y, en general, sobrevolando detalles, el manejo de datos se hace masivamente. También para los algoritmos somos un número. Somos un dato.

Con esto, quiero bajar la espuma de que “están detrás de nosotros”. Sí, lo están, pero no importa tanto quiénes somos, sino qué hacemos y, sobre todo, qué estamos dispuestos a hacer. Importa cómo se vinculan y se relacionan esos datos. Esta información, para la gran mayoría de las aplicaciones, vive en mundos de bits, de algoritmos, de procesamientos automáticos, de modelos, de transferencias, de datos. Y lo mismo da que seamos nosotros o clones. Nos leen los mails, sí, pero en este contexto automatizado: no hay una persona detrás haciéndonos bullying a nuestras espaldas por los chistes malos que mandamos por e-mail o por si preferimos corpiños deportivos o push-ups.

internet-tecnologia-celular-computadora

¿Les pasó o escucharon algo similar a esto?

Ayer, estábamos en un asado hablando del Gol Top, de lo feo que era y tal, y te juro que yo no usé mi celular ni busqué nada. Y hoy, en Facebook, me apareció una publicidad del Gol Top. ¡Culiau, nos están escuchando, no hay otra!

Bueno, es posible que no hayas buscado nada en tu celular, pero seguramente algún otre invitade al asado sí buscó (en el mismo asado, o después, sentade en su inodoro). Y la publicidad contextual de Facebook seguramente relacionó a esa persona con esa búsqueda, con cercanía a otra persona (vos) en el mismo momento y, bueno, se la jugó por tirarte una publicidad de Gol Top (a vos, que también sabe que te movés en auto, que también sabe que vivís en una zona donde se necesita auto, que seguramente sabe o arriesga que tenés guita suficiente o conocés a alguien que le interese el auto -si no capaz la publicidad contextual podría haber sido la de un crédito prendario-). No es que nos escuchan, que sí lo hacen, es que hay mucho malabar de información y datos por detrás para la toma de decisiones. Y el Gol Top sigue siendo muy feo.

Para darnos una noción de cuánto valen esos datos, un botón de muestra: Facebook compró, en el año 2014, a una empresa de mensajería instantánea, con menos de 60 empleados, y unos 600 millones de usuarios mensuales, por una suma cercana a $22.000 millones de dólares. ¿Cuál es esa empresa? WhatsApp. ¿Por qué lo hizo? Entre otras razones seguramente, pero acertaste.

Las empresas y las organizaciones están sedientas de datos para alimentar sus negocios. Creo que está bueno saber que hay varios tipos de negocios alrededor de los datos: los que alimentan la operatoria per se del negocio, los referidos al almacén y computación de esos datos, y los referidos al negocio de los datos mismos. ¿Podrías explicarlo mejor? Claro que sí, sé que no fui claro:

Pensemos en E-Bay, por ejemplo: su negocio se basa en comisionar ventas a través de una plataforma, por lo tanto, manipula datos para intentar que más gente compre más cosas (por ejemplo, a través de recomendaciones de productos, a través de determinar tiempos de envíos de los paquetes -porque tenemos una excitación particular por el “llega hoy”- o a través de determinar si la foto de un artículo puede mejorarse).

Pensemos en Amazon Web Services, ahora: su negocio se basa en dar almacén y poder de cómputo para datos, de forma tal que otras empresas, organizaciones o individuos puedan guardar datos, operarlos y usarlos a través de la infraestructura de esta unidad de negocios.

Y, finalmente, pensemos en Facebook: su negocio se basa en ser intermediario de datos para que otras empresas puedan, a través de la plataforma, llegar a sus clientes de la mejor manera. A Facebook, como a YouTube -entre otros-, les interesa que pasemos mucho tiempo en sus sitios, para que puedan mostrar (e idealmente convertir) más publicidades.

Facebook y Google, entre muchos otros, basan su negocio en la venta de datos: no les pasan a sus clientes un archivo .zip con todos los datos para que hagan lo que puedan, sino que, a través de sus servicios, obtienen beneficios por segmentar y dirigir de la mejor forma posible las publicidades. Vos que tenés una empresa que personaliza la venta de corpiños, a través de mis plataformas, podés llegar con un mensaje ajustado a los perfiles que te interesen (mujeres de 18 a 40 años que vivan en la costa oeste de Estados Unidos, por ejemplo).

Big-data-redes-sociales-algoritmos-internet-02

En ese sentido, se apoyan mucho en la Ciencia de Datos. Van a predecir sobre sus datos. Esto es, no sabrán a cuánto estará el dólar en el futuro, pero quizá puedan hacer su mejor intento. No van a proyectar. Como generalizan a partir de información existente (pasada), no sabrán cuándo será la próxima devaluación del peso (o quizá sí, pero ahí entramos en el plano de la información privilegiada o del esoterismo). Por otro lado, más que proyectar, seguro que pueden influenciar.

¿Vieron los juegos de celular que, a veces, entre nivel y nivel, o vida y vida, muestran una publicidad? Esas publicidades son subastadas en tiempo real. Me explico: los dueños del juego dicen “acá va una publicidad” y contratan un servicio de Google para que ponga allí una publicidad entre nivel y nivel, o vida y vida, a cambio de unos pocos rublos. Lo que pasa tras bambalinas para “mostrar” una publicidad es para mí sorprendente:

—El juego se comunica con Google para decirle “quiero mostrar una publicidad ahora”;

—Google subasta en ese momento una publicidad para el juego en cuestión, brindando todos los datos que sepa de quien está jugando: damas y caballeros, aquí abrimos la subasta para una publicidad de 4 segundos, para une usuarie que está jugando “Candy Crush” en un Motorola G5 Plus, chipeado en el Mercat dels Encants, en Barcelona. Allí son las 16.47 de un día soleado. Tiene 21 años y trabaja de 10 a 19, y le gustan los chuches con forma de jamaica y sabor a tamarindo;

—Las empresas interesadas (donde interesadas significa “de acuerdo a los datos que se le ofrecieron de la persona en cuestión, de la aplicación y de sus objetivos de negocio”) hacen una oferta por ese lugar de publicidad, para ese usuario en particular: 25 rublos allí, ¿quién da más?;

—Google determina quién ganó la subasta, informa al ganador y le da permisos para que ponga su publicidad allí (o pone él mismo la publicidad, no me sé los detalles);

—El ganador muestra la publicidad;

—La persona de 21 años de Barcelona ve la publicidad en el juego y continúa con el siguiente nivel (o sigue el link o descarga la app publicitada).

Todo esto pasa en 300 milisegundos, o menos. Increíble, ¿no?

Estas cosas, entre muchísimas otras, pasan con nuestros datos, producto de la digitalización de los negocios de las últimas décadas. Y detrás de cada una de estas cosas, hay negocios. El vil metal, jóvenes.

El tráfico, la cantidad y la disponibilidad de datos cambia bastante las reglas de juego. Cambia la visión de oportunidades y cambia seguramente la naturaleza de la competencia. Normal en los cambios de paradigma. Nada nuevo. Tampoco son nuevas las consecuencias: las astas del toro las tienen los poderosos. Árabes, jeques, explotadores, bolivarianos y colonizadores, antes. Empresas de tecnología y empresas masivas en participación e interacción online, hoy.

En este sentido, datos no es necesariamente poder, de la misma forma que tener Vaca Muerta no es garantía de un territorio rico. Pero el mercado suele ser Menottista y Bilardista a la vez (?): entiende que los mejores resultados se obtienen como consecuencia de un juego bonito. Y entiende también que ganar es lo único que importa.

Y el círculo virtuoso, o vicioso, se vive también en este contexto. Los negocios (de datos) se autoalimentan: si comprás (o no comprás), es posible agregar información de lo que hiciste (o no hiciste) para intentar reforzar (o cambiar) tus decisiones o tus conductas. Si buscás en Google, disponibilizás información con la cual intentar mostrarte más y mejores cosas (para el negocio).

¿Esto es malo? Yo en lo personal, quiero que “el algoritmo” de YouTube me conozca lo mejor que pueda, porque quiero que me recomiende contenido que estoy interesado en ver y que no conozco. No le presto mi sesión a ningún niñe para que en el futuro las recomendaciones no sean de Peppa Pig, sino de las cosas que YouTube predice que a mí (no al niñe) me interesan.

Más información implica más capacidad de ajustar. Terminamos siendo nosotros los que hacemos click y decidiendo qué compramos, qué vemos, qué buscamos. Pero también somos animales de deseo y de costumbre. Y haremos click y compraremos y veremos y buscaremos aquellas cosas que deseemos y que queramos mucho más rápido que en las que no. Este párrafo es una obviedad, pero decido dejarlo como está: no sabemos si lo que no resta suma.

Me parece que, a diferencia del petróleo, el uso de los datos tiene una visión más endogámica y alimenta los propios intereses, sin repercutir demasiado en los ajenos. Se hizo cliché la frase “cuando el producto es gratuito, el producto sos vos”. Esto es, si no pagás por algo que suena a que deberías, es posible que tus datos (tu permanencia, tus acciones, tus movimientos, tu información personal) estén valiendo mucho. Si sí pagás, tampoco nos aseguramos ninguna conclusión.

Nace preguntarnos, a partir de todo esto, cuáles son los desvíos y los problemas que traen aparejados la obtención, el almacén y el uso de estas grandes cantidades de datos. Intentaremos responder estas preguntas en la siguiente (y última) parte de esta serie.

Los invito a encontrarnos en el próximo artículo.

*Por Walter Alini / Imagen de portada: Juan Pablo Bellini.

Palabras claves: ciencia de datos, Internet, redes sociales

Compartir: