Una guía introductoria a los datos de series temporales

El “tiempo” es una variable crucial cuando se trata de la acumulación de datos. En el análisis de series de tiempo, el tiempo es un elemento importante de los datos.

¿Qué son los datos de series temporales?

Los datos de series de tiempo se refieren a una serie de puntos de datos que están ordenados en el tiempo. Introduce una dependencia de orden entre un conjunto de observaciones. Las series de tiempo son omnipresentes en el mundo actual basado en datos. Como cada evento sigue la flecha del tiempo, estamos en constante interacción con una variedad de datos de series temporales.

Por lo general, se supone que las series de tiempo se generan a intervalos regulares de tiempo y se denominan series de tiempo regulares. Sin embargo, los datos dentro de esa serie temporal no necesitan generarse a intervalos regulares. Estos casos abarcan series temporales irregulares en las que los datos siguen una secuencia escalonada temporalmente. Esto implica que es posible que las mediciones no se realicen a intervalos regulares. Sin embargo, los datos pueden generarse en intervalos de tiempo discretos o como una ráfaga. Los retiros de cajeros automáticos o los depósitos en cuenta son ejemplos de series temporales irregulares.

Técnicamente, en una serie de tiempo, una o más variables cambian durante un período de tiempo determinado. Si una sola variable varía con el tiempo, se denomina serie temporal univariada. Por ejemplo, considere un sensor que mide la temperatura de una habitación cada segundo. Aquí, solo se genera un valor de temperatura unidimensional en cada instante (es decir, segundo). Por el contrario, cuando más de una variable cambia con el tiempo, se denomina serie temporal multivariante. Por ejemplo, considere la economía bancaria. En tales casos, se utilizan series de tiempo multivariadas para comprender cómo los cambios de política en una variable, como la tasa de recompra, pueden afectar otras variables (es decir, el desembolso de préstamos para bancos comerciales).

Los datos de series temporales encuentran su aplicación en todas las disciplinas, desde finanzas, geología, meteorología, fabricación hasta informática, IoT, ciencias físicas y sociales. Se utiliza para realizar un seguimiento de los cambios climáticos, la tasa de natalidad, la tasa de mortalidad, las fluctuaciones del mercado, el rendimiento de la red y muchas otras aplicaciones. Algunos de sus principales casos de uso incluyen monitoreo, pronóstico y detección de anomalías. Por ejemplo, la previsión de series de tiempo juega un papel fundamental en la determinación de la popularidad de los sistemas de gestión de bases de datos. La siguiente figura muestra la creciente popularidad de DBMS a lo largo de los años (2019-2021) en un gráfico de serie temporal.

https://www.influxdata.com/time-series-database/

Componentes clave de la serie temporal

Los factores que influyen en los valores de una observación en una serie de tiempo se tratan como sus componentes clave. Las tres categorías de componentes incluyen:

  • Tendencia o movimientos a largo plazo
  • Movimientos a corto plazo
  • Variaciones estacionales
  • Variaciones cíclicas
  • Movimientos aleatorios o irregulares
  • Tendencia

    La tendencia de los datos a aumentar o disminuir durante un largo período de tiempo se denomina tendencia o componente a largo plazo. Sin embargo, es importante tener en cuenta que el movimiento hacia arriba o hacia abajo no tiene por qué ser necesariamente en la misma dirección durante un período de tiempo determinado.

    Las tendencias pueden subir, bajar o permanecer estables durante diferentes períodos de tiempo. Sin embargo, la tendencia general siempre debe equivaler a un patrón ascendente, descendente o estable. Tales tendencias de movimiento son evidentes en ejemplos como la productividad agrícola, la tasa de mortalidad, los dispositivos fabricados, el número de fábricas, etc.

    Tendencia lineal y no lineal

    Trazar valores de series de tiempo contra el tiempo en un gráfico revela el tipo de tendencia basada en el patrón de agrupación de datos. Si el grupo de datos está más o menos alrededor de una línea recta, entonces la tendencia se denomina tendencia lineal. De lo contrario, el patrón de conglomerados de datos muestra una tendencia no lineal ya que la relación de cambio entre dos variables no es estable ni constante. Por lo tanto, tales tendencias también se denominan correlaciones curvilíneas.

    Movimientos a corto plazo

    En una serie de tiempo, estos componentes tienden a repetirse durante un período de tiempo. Tienen ráfagas cortas irregulares y afectan las variables en estudio. Los dos tipos de categorías bajo el movimiento a corto plazo incluyen:

    Variaciones estacionales

    Estas versiones funcionan de forma regular y periódica durante un período inferior a un año. Tienden a tener un patrón similar o casi el mismo durante un período de 12 meses. Tales variaciones se convierten en parte de una serie de tiempo si los datos se registran regularmente, es decir, cada hora, día, semana, mes o trimestre.

    Las variaciones estacionales son artificiales o naturales. Las diferentes estaciones o condiciones climáticas juegan un papel crítico en tales variaciones. Por ejemplo, la producción de cultivos depende completamente de las estaciones. De manera similar, el mercado de un paraguas o impermeable depende de la temporada de lluvias, mientras que la venta de refrigeradores y unidades de aire acondicionado alcanza su punto máximo durante la temporada de verano.

    Las convenciones hechas por el hombre incluyen festivales, fiestas y ocasiones como matrimonios. Tales eventos a corto plazo se repiten año tras año.

    Variaciones Cíclicas

    Las variaciones de series de tiempo que tienden a operar durante un período de más de un año se denominan variaciones cíclicas. Para una empresa, un período completo se considera el «Ciclo económico». El aumento o la disminución del rendimiento empresarial depende de varios factores, como la estructura económica, la gestión empresarial y otras fuerzas que interactúan. Estas variaciones cíclicas del negocio pueden ser regulares pero no periódicas. Generalmente, las empresas pasan por un proceso cíclico de cuatro fases que comprende prosperidad, recesión, depresión y reactivación.

    Tales variaciones cíclicas son parte integral de un patrón de serie temporal, ya que el desarrollo empresarial depende en gran medida de los «puntos de datos secuenciales» generados.

    Movimientos aleatorios o irregulares

    Los componentes aleatorios provocan una variación significativa en la variable bajo observación. Estas son fluctuaciones puramente irregulares sin ningún patrón establecido. Las fuerzas son imprevistas, impredecibles y de naturaleza errática, por ejemplo, terremotos, inundaciones, hambrunas y otros desastres.

    Los eventos aleatorios descritos anteriormente se analizan utilizando los datos de la serie temporal de origen para abordar mejor los escenarios de la vida real que pueden ocurrir en el futuro.

    Tipos de series temporales

    Los datos de series de tiempo se pueden dividir en cuatro tipos, deterministas, no deterministas, estacionarios y no estacionarios. Echemos un vistazo a cada tipo en detalle.

    #1. Serie temporal determinista

    Una serie de tiempo determinista se puede describir con una expresión analítica. No involucra aspectos aleatorios o probabilísticos. Matemáticamente, se puede expresar exactamente para todos los intervalos de tiempo en términos de una expansión de la serie de Taylor. Esto es posible si todos sus derivados se conocen en algún momento arbitrario. Estos derivados especifican explícitamente el pasado y el futuro en ese momento. Si se cumplen todas las condiciones, es posible predecir con precisión su comportamiento futuro y analizar cómo se comportó en el pasado.

    #2. Series temporales no deterministas

    Una serie temporal no determinista tiene asociado un aspecto aleatorio que impide su descripción explícita. Por lo tanto, las expresiones analíticas no son soluciones lo suficientemente factibles para expresar una serie de tiempo de este tipo. Una serie de tiempo puede ser no determinista debido a las siguientes razones:

  • La información requerida para describirlo no está disponible en su totalidad. Aunque los datos pueden estar presentes en principio, no pueden tratarse como cuantificables explícitamente.
  • El proceso de generación de datos es de naturaleza aleatoria.
  • Debido al factor aleatorio, la serie temporal no determinista obedece a leyes probabilísticas. Por lo tanto, los datos se abordan en términos estadísticos, lo que implica que los datos se definen mediante distribuciones de probabilidad y promedios de varias formas. Esto incluye medias y medidas de dispersión, es decir, varianzas.

    #3. Series temporales estacionarias

    En una serie temporal estacionaria, las propiedades estadísticas como la media, la varianza y otras no dependen del aspecto temporal. Una serie de tiempo estacionaria es más fácil de predecir, ya que se puede afirmar con certeza que sus propiedades estadísticas seguirán siendo las mismas que se observaron en el pasado. Por lo tanto, varios métodos estadísticos de pronóstico se basan en el argumento de que la serie de tiempo es casi estacionaria. Esto implica que la serie temporal puede considerarse estacionaria en aproximación aplicando transformaciones matemáticas simples.

    #4. Series temporales no estacionarias

    En una serie no estacionaria, las propiedades estadísticas varían con el tiempo. Por lo tanto, las series de tiempo con tendencias o estacionalidad caen dentro de la categoría no estacionaria ya que la tendencia y la estacionalidad pueden afectar el valor de la serie de tiempo en diferentes intervalos de tiempo. Las series de tiempo no estacionarias describen datos impredecibles, lo que impide que se modelen o pronostiquen.

    https://www.oreilly.com/library/view/hands-on-machine-learning/9781788992282/15c9cc40-bea2-4b75-902f-2e9739fec4ae.xhtml

    Análisis y Pronósticos de Series de Tiempo

    El análisis y pronóstico de series de tiempo son herramientas útiles para observar, analizar y estudiar la evolución y dinámica de procesos vitales y objetos de diferentes tipos. Veamos cada uno con mayor profundidad.

    Análisis de series temporales

    El análisis de series de tiempo se define como un proceso de análisis de los datos recopilados durante un período de tiempo. Aquí, los analistas de datos registran datos en intervalos constantes durante un período de tiempo fijo. La tasa de observación de datos, es decir, el intervalo de tiempo, puede variar desde segundos hasta años.

    Los datos de series de tiempo describen las variables bajo inspección, ya que proporcionan un análisis detallado del patrón fluctuante durante un período de tiempo específico. Los parámetros necesarios para el análisis pueden variar entre diferentes dominios y disciplinas. Algunos de los ejemplos pueden incluir:

    • Instrumentos científicos – Datos registrados por día
    • Sitio web comercial – Visitas de clientes por día
    • Mercado de valores – Valores de las acciones por semana
    • Temporada – Días de lluvia al año

    Para garantizar la consistencia y la confiabilidad, el análisis de series de tiempo opera en grandes cantidades de puntos de datos. Un buen tamaño de muestra es una representación sutil de la autenticidad de una tendencia o patrón descubierto.

    Además, el análisis de series temporales también es adecuado para predecir eventos futuros en función de datos registrados en el pasado.

    Pronóstico de series de tiempo

    El análisis de series temporales permite a las organizaciones identificar la causa raíz de las fluctuaciones en las tendencias a lo largo del tiempo. Con los datos disponibles, las empresas pueden estudiar e investigar más para comprender mejor cómo abordar las tendencias desconocidas y pronosticar los próximos eventos. Las empresas generalmente emplean técnicas de visualización de datos para determinar tales anomalías en los datos.

    La previsión de series temporales gira en torno a dos factores esenciales:

  • Anticipe sucesos futuros en función del comportamiento de los datos anteriores.
  • Suponga que las próximas tendencias tendrán similitudes con el patrón de datos anterior.
  • En la previsión, el objetivo principal es esencialmente predecir cómo los puntos de datos seguirán siendo los mismos o variarán en el futuro. Aquí hay algunos ejemplos de diferentes sectores de la industria para comprender mejor los matices del análisis y pronóstico de series temporales.

    • Mercado de valores: pronosticar el precio de cierre de las acciones cada día.
    • Ventas: prediga las ventas de productos de una tienda cada día.
    • Precios: Pronóstico del precio promedio del combustible cada día.

    Algunas de las técnicas estadísticas comunes utilizadas para el pronóstico de series de tiempo incluyen el promedio móvil simple (SMA), el suavizado exponencial (SES), el promedio móvil integrado autorregresivo (ARIMA) y la red neuronal (NN).

    Datos de series temporales en la nube

    Para revelar el valor de los datos de series temporales, las empresas deberían poder almacenar y consultar datos rápidamente. Las empresas del mercado de capitales dependen de grandes volúmenes de datos históricos y de transmisión para emplear análisis de datos en tiempo real y tomar decisiones comerciales impactantes. Esto puede implicar predecir la vulnerabilidad de los precios de las acciones, determinar los requisitos de capital neto o pronosticar los tipos de cambio. Para brindar flexibilidad y procesar los datos sin problemas, muchas empresas están optando por migrar sus bases de datos de series temporales a la nube.

    Con la migración de bases de datos de series temporales a las nubes, las organizaciones pueden obtener acceso a recursos ilimitados bajo demanda. Permite a las empresas utilizar cientos de núcleos para realizar su tarea que maximiza el rendimiento de la red sin problemas de latencia.

    Las bases de datos de series temporales en la infraestructura de la nube son adecuadas para cargas de trabajo con uso intensivo de cómputo. Esto incluye realizar cálculos de riesgo en respuesta a las tendencias del mercado en tiempo real. Las firmas financieras pueden eliminar los gastos generales del centro de datos y concentrarse en utilizar los recursos para mejorar la productividad de sus cargas de trabajo.

    Los proveedores de la nube, como AWS, ofrecen flujo de tiempo de Amazon, un servicio de base de datos de series temporales que permite cargar, almacenar y analizar fácilmente conjuntos de datos de series temporales. Ofrecen almacenamiento para administrar cargas de trabajo de transacciones intensivas, herramientas de análisis en tiempo real y funcionalidad de transmisión de datos para presentar eventos a medida que ocurren.

    Por lo tanto, la infraestructura de la nube amplifica y escala los beneficios de los datos de series temporales.

    Aplicaciones de series de tiempo

    Los modelos de series de tiempo tienen dos propósitos,

  • Comprender los factores subyacentes que produjeron un determinado patrón de datos.
  • Con base en el análisis, ajuste un modelo para pronosticar y monitorear.
  • Veamos algunos de los casos de uso de aplicaciones de datos de series temporales.

    #1. Series temporales en el dominio financiero y empresarial

    Todas las decisiones financieras, comerciales y de inversión se toman en función de las tendencias actuales del mercado y las previsiones de demanda. Los datos de series temporales se utilizan para explicar, correlacionar y predecir el mercado financiero dinámico. Los expertos financieros pueden examinar los datos financieros para brindar pronósticos de aplicaciones que ayuden a mitigar el riesgo, estabilizar los precios y el comercio.

    El análisis de series de tiempo juega un papel clave en el análisis financiero. Se utiliza en la predicción de tasas de interés, pronosticando la volatilidad en los mercados bursátiles y muchos más. Las partes interesadas del negocio y los responsables de la formulación de políticas pueden tomar decisiones informadas sobre la fabricación, las compras, la asignación de recursos y optimizar sus operaciones comerciales.

    Este análisis se usa efectivamente en el sector de inversión para monitorear las tasas de seguridad y sus fluctuaciones en el tiempo. El precio del valor también se puede observar a corto plazo (es decir, datos de registro por hora o día) oa largo plazo (es decir, observación extendida durante meses o años). El análisis de series temporales es una herramienta útil para realizar un seguimiento del rendimiento de un valor, un activo o una variable económica durante un período de tiempo prolongado.

    #2. Series temporales en el dominio médico

    El cuidado de la salud está emergiendo rápidamente como un campo basado en datos. Además del análisis financiero y comercial, el dominio médico está aprovechando en gran medida el análisis de series temporales.

    Considere un escenario que requiere una sinergia de datos de series temporales, procedimientos médicamente alineados y técnicas de extracción de datos mientras trata a pacientes con cáncer. Dicho marco híbrido puede emplearse para aprovechar las funcionalidades de extracción de características de los datos de series temporales recopilados (es decir, las imágenes de rayos X del paciente) para realizar un seguimiento del progreso del paciente y la respuesta a los tratamientos proporcionados por la fraternidad médica.

    En el sector de la salud, derivar inferencias de los datos de series temporales en constante cambio tiene un valor fundamental. Además, las prácticas médicas avanzadas exigen que los registros de los pacientes estén conectados a lo largo del tiempo para una mejor visibilidad de la salud del paciente. Además, los parámetros de salud del paciente deben registrarse con precisión a intervalos regulares para tener una imagen más clara del estado de salud del paciente.

    Con el avance de los instrumentos médicos avanzados, el análisis de series de tiempo se ha establecido en el dominio de la atención médica. Considere los siguientes ejemplos,

    • Dispositivos de ECG: Dispositivos inventados para monitorear condiciones cardíacas mediante el registro de los pulsos eléctricos del corazón.
    • Dispositivos EEG: Dispositivos utilizados para cuantificar la actividad eléctrica en el cerebro.

    Dichos dispositivos han permitido a los médicos realizar análisis de series temporales para un diagnóstico médico más rápido, efectivo y preciso.

    Además, con el advenimiento de los dispositivos IoT, como los sensores portátiles y los dispositivos portátiles para el cuidado de la salud, las personas ahora pueden realizar mediciones periódicas de sus variables de salud a lo largo del tiempo con insumos mínimos. Esto conduce a una recopilación de datos consistente de datos médicos dependientes del tiempo para personas sanas y enfermas.

    #3. Series temporales en astronomía

    La astronomía y la astrofísica son las dos disciplinas modernas donde los datos de series temporales se aprovechan de manera significativa.

    Fundamentalmente, la astronomía implica trazar las trayectorias de los objetos cósmicos y los cuerpos celestes y realizar mediciones precisas para comprender mejor el universo más allá de la atmósfera terrestre. Debido a este requisito, los expertos en astronomía dominan el manejo de datos de series temporales mientras calibran y configuran instrumentos complejos y estudian objetos astronómicos de interés.

    Los datos de series temporales se han asociado durante mucho tiempo con el campo de la astronomía. En el año 800 a. C., se recopilaron datos de series temporales de manchas solares a intervalos regulares. Desde entonces, el análisis de series de tiempo se ha utilizado para

    • Descubre estrellas lejanas basadas en distancias estelares,
    • Observa eventos cósmicos como supernovas para comprender mejor el origen de nuestro universo.

    Los datos de series temporales, en este caso, se relacionan con las longitudes de onda y las intensidades de la luz emitida por estrellas, cuerpos celestes u objetos. Los astrónomos monitorean constantemente dichos datos de transmisión en vivo para detectar eventos cósmicos en tiempo real a medida que ocurren.

    En los últimos tiempos han surgido áreas de investigación como la astroinformática y la astroestadística, que fusionan diversas disciplinas como la minería de datos, el aprendizaje automático, la inteligencia computacional y la estadística. En estas áreas de investigación novedosas, el papel de los datos de series temporales es detectar y clasificar objetos astronómicos de manera rápida y eficiente.

    #4. Series temporales en la predicción del tiempo

    Aristóteles estudió ampliamente los patrones climáticos para comprender mejor las causas y los efectos observados en los cambios climáticos en la antigüedad. A medida que avanzaban los días, los científicos comenzaron a registrar datos relacionados con el clima en instrumentos como el «barómetro» para calcular las variables atmosféricas. Los datos se recolectaron en intervalos regulares y se mantuvieron en diferentes lugares.

    Con el tiempo, eventualmente, los pronósticos del tiempo comenzaron a aparecer en los periódicos. Avance rápido hasta el día y la edad de hoy, las estaciones de pronóstico del tiempo ubicuas están instaladas en diferentes geografías alrededor del mundo para recopilar variables meteorológicas precisas.

    Estas estaciones tienen dispositivos funcionales avanzados que están interconectados para recopilar y correlacionar datos meteorológicos de varios lugares. Los datos correlacionados se utilizan para pronosticar las condiciones climáticas en cada instancia de tiempo según los requisitos.

    #5. Series temporales en el desarrollo empresarial

    Los datos de series temporales permiten a las empresas tomar decisiones comerciales. Esto se logra a medida que el proceso analiza datos pasados ​​para derivar eventos futuros y arrojar luz sobre posibilidades probables. El patrón de datos pasados ​​se utiliza para derivar los siguientes parámetros:

    • Crecimiento empresarial: para evaluar el rendimiento financiero y empresarial general y medir el crecimiento, los datos de series temporales son el activo más adecuado y fiable.
    • Estimar la tendencia: se pueden emplear varios métodos de series de tiempo para estimar las tendencias emergentes. Considere, por ejemplo, que estos métodos analizan las observaciones de datos durante un período de tiempo para reflejar un aumento o disminución de las ventas de un dispositivo electrónico en particular.
    • Revelar patrones estacionales: los puntos de datos registrados podrían revelar fluctuaciones y patrones estacionales que podrían ayudar en la previsión de datos. La información de los datos obtenidos juega un papel clave para los mercados donde los precios de los productos fluctúan estacionalmente. Dichos datos pueden ayudar a las empresas a mejorar la planificación y el desarrollo de productos.

    Conclusión 👨‍🏫

    En resumen, los datos de series de tiempo pueden verse como las características de puntos de datos complejos recopilados durante un período de tiempo constante. El análisis, el modelado y la previsión de series temporales se han convertido en una parte integral de nuestra vida cotidiana con la aparición de dispositivos IoT, electrodomésticos inteligentes y dispositivos portátiles. Además, los datos de series temporales están encontrando su aplicación en diversos campos, que incluyen atención médica, astrofísica, economía, ingeniería, negocios y muchos más.