Instituto Complutense de Análisis Económico UNIVERSIDAD COMPLUTENSE FACULTAD DE ECONOMICAS Campus de Somosaguas 28223 MADRID Teléfono 394 26 11 - FAX 294 26 13 "' Documento de trabajo ¿Incorpora la Contabilidad Nacional Trimestral de España información útil de indicadores? Gema de Cabo Serrano No.9708 Junio 1997 Instituto Complutense de Análisis Económico UNIVERSIDAD COMPLUTENSE ¿INCORPORA LA CONTABILIDAD NACIONAL TRIMESTRAL DE ESPAÑA INFORMACIÓN ÚTIL DE INDICADORES? Gema de Cabo Serrano Departamento de Economía Cuantitativa Universidad Complutense de Madrid 28223 Madrid Te!.: 394 2384. Fax: 394 259l e-mail: eccua26@sis.ucm.us ABSTRACT This paper presents a study abaut limitations of the infonnation of indicators incorporated in Spanish Quarterly National Aceúunt series due to the treatment and the limited availability of indicators used in their estimation. As a result, it is shown that Quarterly National Aceúunt series do not have stochastic structures typícal for economic series and that for Supply and sorne of Demand variables there are no indicators in all oc part of the sample. Besides, their potencial users are reported on the negative effects that the use of series with those features may cause in empirical applications. RESUMEN Este artículo expone un estudio de las limitaciones de la información de indicadores incorporada en las series de Contabilidad Nacional Trimestral de España, debido al tratamiento y a la limitada disponibilidad de indicadores utilizados en su estimación. Como resultado, se demuestra que las series de Contabilidad Nacional Trimestral presentan estructuras estocásticas poco habituales en series económicas y que para las variables de Producción y algunas de Gasto Agregado no existen indicadores en toda o parte de la muestra. Además, se informa a sus usuarios potenciales de los efectos negativos que el uso de series con tales características puede generar en aplicaciones empíricas. ... 1. INTRODUCCIÓN Este trabajo ofrece un estudio de las limitaciones de la información de indicadores incorporada en las variables de Contabilidad Nacional Trimestral (CNT) de España, debido al tipo de tratamiento .. { y a la disponibilidad, en algunos casos escasa o inexistente, de indicadores trimestrales y mensuales para estimar la CNT, Los resultados presentados se obtienen de la investigación de los aspectos conceptuales, técnicos y empíricos de la CNT de España. expuesta detalladamente en Cabo (1996). Estos resultados pueden ser relevantes para los usuarios potenciales de la CNT porque (1) descubren algunas características estadísticas de las variables de CNT, atípicas en series temporales económicas, detenninadas por los procesos de selección y tratamiento de los indicadores, (2) muestran configuraciones gráficas llamativas de algunas variables de CNT, ocasionadas por la falta y/o escasez de indicadores, (3) revelan que algunas variables de CNT se construyen sólo con infoonación anual, en toda o parte de la muestra, y (4) ofrecen argumentos para considerar que la CNT no es un sistema de información homogéneo ni útil globalmente para aplicaciones econométricas. Es bien conocido que no existe una metodología de trimestralización de Contabilidad Nacional (eN) homogénea, En OPOCE (1995) se distinguen las metodologías directas, aplicadas p.e. en Estados Unidos y Canadá, y las indirectas, utilizadas p,e. en Francia y España, cuyas diferencias radican en el uso de la información de indicadores de forma directa o a través de un modelo de regresión. De los dos aspectos que constituyen estas metodologías, el técnico y la eficacia del sistema de información estadística, el primero es objeto de atención en numerosos trabajos acerca de los diferentes métodos de desagregación temporal y sus mejoras [véase, p.e. Guerrero (1990) y Cholette y Dagum (1994)]. Respecto al segundo, sin embargo, es habitual suponer la existencia de indicadores, sin analizar las consecuencias de su tratamiento y disponibilidad sobre las series de CNT construidas. La utilidad de la información de indicadores en la estimación de una serie de CNT radica en (1 ) disponer de alguno, (2) con una cobertura, un sistema de medida y un ámbito conceptual lo más relacionado posible con la variable a construir, y (3) Con disponibilidad anterior a la publicación del último dato trimestral a estimar. Sin embargo. para algunos componentes del Producto Interior Bruto (Pill) no se dispone de indicadores con ta1es características. Además, aunque no es recomendable emplear de fanna automática técnicas para construir un modelo univariante y para investigar la estacionaHdad de cada indicador, en algunas metodologías de trimestralización es una práctica habitual el uso indiscriminado de métodos de análisis de series temporales y de desestacionalización. Por tanto, es de esperar que estos inconvenientes afecten a las series de CNT estimadas. El fin de este trabajo es doble: (1) mostrar los efectos nocivos que producen las deficiencias descritas relativas al uso de indicadores en las variables de CNT y (2) advertir de los efectos desfavorables que se pueden derivar del uso de las variables de CNT en la práctica econométrica. Se estudia la CNT de España, elaborada por el Instituto Nacional de Estadística (lNE). La metodología empleada, descrita en INE (1993a), consiste en la aplicación del método de Chow y Lin (1971) a las series de Contabilidad Nacional Anual (CNA), con la información de índices sintéticos construidos a partir de indic~ores sometidos a procesos de selección y tratamiento. Las variables de CNT se revisan cada vez que se estima un nuevo dato trimestral. En adelante, se denomina revisión de una variable de CNT a la serie histórica en la que se incorpora por primera vez el último trimestre estimado, p.e. Consumo Público en pesetas corrientes de la muestra I170·IV/92 es la revisión de esta variable del IV/92 (se extiende a variables de CNA al considerar el último año en vez del úilimo trimestre). Este trabajo se organiza como sigue. En la Sección 2 se describen e ilustran las propiedades estadísticas y gráficas de las variables de CNT descubiertas por una exploración univariante. Se presentan, con un caso representativo, los resultados del análisis univariante de la mayoría de las series de CNT. También se muestran las excepciones, donde destacan las variables cuyas configuraciones gráficas suscitan dudas respecto al uso de indicadores en su estimación y, por tanto, motivan el estudio de la presencia de ,ipdicadores en la CNT. A tal fin, en la Sección 3 se describe la construcción de /1 series trimestrales,~in usar indicadores, con la metodología que el INE aplica para elaborar la CNT. Los resultados de la comparación entre las series construidas y sus análogas de CNT se interpretan e ilustran en la Sección 4. Finalmente, en la Sección 5 se resumen las conclusiones. En el Apéndice I se describen los mnemotécnicos, identidades y fuentes de datos usados de la CNT. En el Apéndice 2 se expone la distribución de series anuales basada en el método de Ch0"t y Lin (1971). 2 c; 2. EXPLORACIÓN UNIVARIANTE DE LAS VARIABLES DE CONTABiliDAD NACIONAL TRIMESTRAL La exploración univariante de los rasgos individuales de las variables de CNT tiene el fin de buscar y exponer compatibilidades y peculiaridades. Los resultados de esta exploración, aplicarla a las series de la revisión IV /92, se extraen de dos frentes: la construcción de modelos' univariantes y la observación de configuraciones gráficas llamativas. La exploraci6n realizada muestra que las variables de CNT se pueden agrupar en categorías con características comunes. Esto permite comprender que cada variable no está aislada de las demás, sino que se integra en una estructura de interrelaciones que. además, permite una simplificación de la investigación. De hecho, el comportamiento de un subconjunto de variables, agregados y detlactores implícitos, se puede determinar a través de las identidades contables que verifican con las demás. 2.1 Análisis univarlante y de intervención El análisis U11 conjuga el análisis univariante, expuesto en Box et al. (1994), con el análisis de intervención, presentado en Box y Tiao (1975). Se aplica al PIB Y a la mayoría de sus componentes. Con el fin de investigar y comparar diversas especificaciones, para cada variable analizada se construyen modelos en las transformaciones Vln y V21n, donde Vd (d $ 2) indica el número de diferencias regulares y In es la transfonnaci6n logarítmica. Todos los modelos elaborados se estiman por Máxima Verosimilitud Exacta con el algoritmo de Mauricio (1995). En este trabajo, el análisis un no se aplica a la construcción de modelos para los usos habituales de la práctica econométrica, p.e. la previsión; por esta razón, no se elige un modelo concreto entre los dos elaborados para cada variable. Por el contrario, permite descubrir que las series de CNT anaJizadas presentan propiedades estadísticas similares, en concreto: (1) necesidad de la transfonnación logarítmica, (2) orden de integración dos. con pocas excepciones y/o dudas. (3) media nula en la segunda diferencia, (4) con alguna excepción, estructuras ARIMA(I,I,l) con media positiva ó IMA(2, 1), ambas con parámetro negativo en la parte MA, y (5) compatibilidad de estructuras estocásticas e intervenciones entre grupos de variables relacionadas mediante identidades contables. 3 La presencia de estructura MA con parámetro negativo no es frecuente en series temporales económicas. Parece determinada por alguna de las técnicas de análisis y tratamiento de series temporales empleadas por el INE para construir la CNT, examinadas en detalle en Cabo (1996). En concreto, el método de análisis univariante utilizado para construir un modelo de cada indicador seleccionado, se aplica de forma automática bajo supuestos insuficientemente justificados sobre p.e. los órdenes de los operadores MA y AR, los inputs de intervención utilizados, el criterio de estimación aplicado, etc., y puede provocar errores de modelización. Además, la distribución y extrapolación de las series de CNA con el método de Chow y Lin (1971), se basa en supuestos arbitrarios acerca de la estructura del término de error del modelo de regresión que lo fundamenta y detennina la estimación de series trimestrales cambiantes entre revisiones. Sin embargo, ninguno de ambos métodos puede generar la estructura MA considerada. Por tanto, el método de Melis (1991), utilizado para estimar un componente ciclo-tendencia de los índices sintéticos, parece ser la causa. No sólo se aplica de forma automática, lo que impide el estudio de la estacionaJidad propia de cada Índice y explica la aparición sistemática de una estructura MA con parámetro negativo en los modelos construidos para las series de CNT analizadas, sino que elimina información potencialmente útil de indicadores al estimar un único componente arbitrariamente definido de cada índice. 2.2 ilustración: Deflactor de los Servicios Totales Como ejemplo ilustrativo de la aplicación del análisis UTI, se ofrecen los resultados para PS. Los informes gráficos son esenciales en las etapas de identificación y diagnosis. Para cada transfonnación de PS y para los residuos de los modelos estimados, se construyen los gráficos de evolución temporal con el eje vertical tipificado y. a su derecha, de las funciones de autocorrelación simple (ae/) y parc¿l (pac/) (arriba y abajo, respectivamente). Junto al nombre de la serie representada, 'J al pie de cada gráfico temporal se presentan la media muestral, con su desviación típica entre paréntesis, y la desviación típica estimada, todos ellos expresados en porcentajes. Para los residuos de cada modelo estimado, además, se presenta el estadístico Q de Ljung y Box (1978) calculado con 15 valores de la acf. 4 - A partir de los instrumentos gráficos y estadísticos de identificación, véase Figura 2.1, se especifican como alternativos un modelo ARIMA(l,l,l) con media positiva y un IMA(2,1). Se observan algunas anomalías, cuya influencia sobre las estructuras estocásticas se estudia individual y conjuntamente. La Tabla 2.1 contiene los modelos de intervención construidos, donde &0' ~ y cr a son el coeficiente estimado de las variables de intervención, la media estimada de la serie estacionaria y la desviación típica estimada del modelo, todos ellos expresados en porcentajes, así como el y $1 son los parámetros estimados MA y AR, respectivamente. Tabla 2.1: Modelos de intervención: PS Anomalías influyentes Estructura ARMA Transfonnación roo p e, $, "a (Modelo) Fecha % % % VlnPS m9 ".6(.2) 2.4(9) -.46( 11) .96(.03) 28 (M1) U81 .5(.2) V 21nPS "79 -.6(.2) -.45(.11) 28 (M2) U81 .5(.2) Los Modelos MI y M2 incluyen únicamente las anomalías influyentes, que son escalones en el nivel de la serie, y tienen parámetros estimados que no difieren significativamente. Además, el material diagnóstico en ambos casos, véase Figura 2.2, parece compatible con la hipótesis de ruido blanco. 2.3 Excepciones al análisis univariante Algunas variables de CNT presentan configuraciones gráficas que obstaculizan la aplicación del análisis UTl Se pueden distinguir los tres grupos descritos a continuación. L Las variables flujo de Consumo Privado Nacional presentan: (1) una evolución temporal no homogénea, con tres regímenes relativos a las submuestras JJ70-IV/80, I/81-IV/86 y JJ87-IV/92, (2) varianza diferente entre los tres regfmenes, la del segundo mayor que la del tercero y ésta mayor que la del primero, y (3) valores positivos, que se amortiguan lentamente, en los retardos anuales de la acf en las transformaciones Vln y V21n. Esta configuración, véase p.e. V21nQC1 en Figura 2.3, 5 sugiere una estructura anual no estacionaria que parece provocada esencialmente por la evolución temporal de los datos del segundo régimen, dos positivos seguidos de dos negativos. Además, aconseja tomar una diferencia anual que, aunque se encuentra avalada por la evidencia gráfica descrita, es llamativa en ~eries estimadas a partir de índices sintéticos desestacionalizados. 2. Las variables YO, YSN, YTI, QTI, YTE Y QA presentan tramos aproximadamente constantes de cuatro valores en el gráfico temporal de su transformación V21n, véase p.e. V 21nQAt en Figura 2.4. En la Sección 4 se demuestra que esta configuración gráfica está muy relacionada con la observación de Alvarez (1989) acerca de escasez y/o falta de disponibilidad y cobertura de indicadores para las variables Gasto Público, Producción Agrícola, Servicios no destinados a la venta, Impuesto sobre el Valor Añadido e Impuestos netos a la importación de CN. Estas dificultades respecto a indicadores de Valor Añadido Bruto a precios de mercado se confirnum en Martín (1991), donde se sugiere cautela en el uso de indi.cadores de empleo para las variables, p.e. Servicios no destinados a la venta y algunas subramas de Producción Industrial, y se indica la dificultad para estimar las ramas con elevado nivel de autoconsumo, p.e. Producción Agrícola. 3. No se aplica logaritmos a ninguna variable de Variación de Existencias. Para ambas variables flujo es coherente con el tratamiento de las variables de CNA análogas, realizado en Treadway et aL (1994) con las series de Gasto Agregado de CNA. Pero el deflactor tiene varios datos negativos, 10 que es excepcional en un deflactor implícito y una ruptura de la coherencia con su correspondiente variable anual, tratada con logaritmos en dicho trabajo. Además, el ratio RVt :: PV/' PYI' véase Figura 2.5, se puede considerar constante en el nivel, aunque tiene las mismas importantes anomalías de PV y puede presentar heterocedasticidad al no haberse aplicado logaritmos. Estas caracteósticas, que i tambié~se observan en el ratio análogo con variables de CNA expresadas en logaritmos, sugieren una práctica contable de imputación seguida en el lNE. 2..4 Estructura de relaciones entre las variables de Contabilidad Nacional Trimestral En un sistema de variables organizado en identidades contables no es necesario el manejo de todas \ las variables que lo integran, sino que basta con elegir aqu'ellas que aseguran la generación de las 6 restantes, con la ventaja adicional de simplificar el maneJ' di' o e SIstema. Además, el uso de variables residuales, que permiten el cumplimiento de identidades y no es neces' l' I ' ano ana Izar as explíCitamente es una práctica contable sensata y hab,"ual en ' sistemas de variabl . es que no tienen una variable reconocida a tal fin. Ambas ideas pueden a Ji I p carse a a CNT. porque sus variables se organ,'zan en identidades contables, véanse las expresiones [Al tl-{Allll d 1 A ' d' . . e pen Ice Al, Y algunas parecen razonables candidatas a variables residuales debido a la dificultad y/o la falta de fi b'l'd d ' a 11 a para medulas. Todo ello facilita la elecci6n de un subconjunto de variables a estudiar de C,..,rn-.~ l' ' 1 ..... " ... exp IClta ( 1 ) Se ignoran las variables 1 de Gasto Agregado y las variables N y S de P d '6 ro UCCl n, que se generan a partir de sus componentes, ecuaciones {AI.5HA1.l0). (2) Se obtiene YY a partir de sus componentes de Producción ecuación lAI 3] , . ,y se trata como variable residual a YV en la identidad de YY en fun iOO de c sus componentes de Gasto Agregado, ecuación [Al.l]. (3) Se estima QYa partir de sus componentes de Producción ecuación lAI 4J ' , . ,y se conSidera QO como variable residual en la identidad del Gasto Agreg d de QY a o , para resolver la ecuación [AL2j. A partir de las interrelaciones (1) (2) (3) , , y se pueden estlmar todas las variables flujo. (4) Se considera la cuasi-identidad entre PV PY r ad I Y , exp lc a e Apartado 2.3, para detenninar PV Se resuelve QVen su identidad de triada [A1.ll]. . Con las interrelaciones descritas en (1) (2) (4) , , y , se genera la tnada V completa. (5) Se resuelven las identidades de triada partic l' d I "- , u arlzan o a ecuaClOn [A 1 .11] con cada componente del Pffi, para obtener los deflactores implícitos de C G lB IC X E Y A ' , , , , , , ,NI,NC,SV, SN, TI y TE. Por tanto, a Partir de i 3 variables en pesetas corrientes Ye YG YIB YIC l'X YE Y" y , , , , , , ,n, NI, YNC, YSV, YSN ITI e ITE y 12 'bl ' ,vana es en pesetas constantes de 1986 QC QJB QIC QX Q , , , , , E, QA, QNI, QNC. QSV, QSN, QTl y QTE, se pueden resolver todas las demás. Estas 25 variables flujo son las que se siguen investigando separadamente. 7 --, 4 2 __ _ ,::~)I,¡j,l,lJIt!l,HIII. I OOi -4 '::c-::-:c,-c,:-:::-::::-::::--'::c-=",=-:;:;-;:; 70 72 74 76 78 80 82 84 86 88 90 92 (a) Serie lnPS, tipificada CW = 387.69%(9.05%), Uw = 86.84%) Y su acf. 4 -4'::c~--~:-:::-::::-~~=~~-;:; 70 72 74 76 78 80 82 84- 86 Ba 90 92 1.00] : . , O":¡IUllllfJIIJI'I± owl 1.001 I i . " :::~' , .... ., ___ _ .J _ ____ ~ O,. ________ ~::::_--- 0>0 I I 1 oo. : 4 B '2 (b) Serie VlnPSt tipificada (w = 2.97%(0.13%), Uw = 1.24%) Y sus acfy puef. 4 :.::ll'-:'II;-111111. . - ---¡----- -.,.--- - -+ ------ -o JI I , 4- 8 12 -4~ ______ ~ ______________ __ 70 72 74 76 78 80 82 84 86 88 90 92 :::~ ...... : .. t ..... t ...... . o I i :::I J .: 4 8 12 (e) Serie V21uPS( tipificada (w = 0.02%(0.03%), Uw = 0.33%) Y sus acfy pacf. Figura 2.1: lrutrumentos gráficos y estadísticos de identificación: PS. 8 • 4 i -4~1 ________________ ~ ____ ___ 72 74 76 78 8::: 82 84 86 88 9:t 92 (a) Residuos tipificados del Modelo Ml (a = 0.04%(0.03%), Ú a =:= 0.28%) y sus aif(Q(15) = 14.7} Y pacj. 4 ° 1S! .-+ oi I , I ; ,i 1. lid 1 '1 , - j- + " :::RE··.·.·····'. + ........... . o ' " 0'5 ' """-1" .----+ O,JO 4 6 12 7(~ 72 74 76 "78 80 82 84- 88 88 90 92 (b) Residuos tipificados del Modelo M2 (a = 0.02%(0.03%), üa = 0.28%) Y sus aif(Q(15) = 12.1) Y pago Figura 2.2: Instrumentos gráficos y estadísticos de diagnosis: PS . 9 6 -4 -,~~~~~~~~~~~~-= 70 72 74 76 78 80 82 84 86 88 90 92 '"' ,,1 11 ; te . :::h~ . , , :::~' o . -- -¡ ""·';"'·'··'T --- I ",'++' 041 ; '" 4 8 '2 Figura 2.3: Serie V2InQC, tipificada (w = -0.02%(0.09%), o-w = 0,83%) Y sus acfy pacj, 70 72 74 76 78 80 82 84 86 88 90 92 ::;~I+ " , :.:~ ..... - - - .--,-----.--, -- ---- 4 6 .~ :::~' '.-·----1- ---I-P-;-;-+-- T , .... p 040, , 08: ! Figura 2.4: Serie V21nQAt tipificada (w == -0.01 %(0,14%), o-w = 1.29%) Y sus acjy pacj. 6 -, 6 ~~--:c..".,,-,~,,....,~::-:-~~--:::c-= 70 72 74 76 '8 8~ 82 84 86 88 90 92 ::;1 +1 1I ,~ o JJ! :::~.: .... , ... , o ' : 0,17 _ ' i +,., .... 0_33 4 8 12 Figura 2.5' Serie RY1 tipificada (w = J04.55%(J3, JI %), o-w = 125.70%) Y sus acfy pacf- 10 3. MÉTODOS DE CONSTRUCCiÓN DE VARIABLES SIN INDICADOR Las propiedades estadísticas y gráficas de las variables de CNT, presentadas en la Sección 2, sugieren dudas acerca de la utilidad de la información de indicadores incorporada en la estimación de algunos componentes del Pffi. Con el fin de comprobar y evaluar el uso de indicadores en la estimación de las variables de CNT, se investiga la construcción de series trimestrales con la metodología empleada por el lNE para estimar la CNT y sin utilizar indicadores. En concreto, se realiza la distribución de las series de CNA con el método de Chow y Un (1971), descrito en el Apéndice Al. Como no se utilizan indicadores, la matriz de indicadores contiene s610 una constante. Particularizando en la expresión [A2.9], se obtiene el estimador de una serie trimestral: [3.1J donde la matriz Xq es el vector 4Txl de unos iq, correspondiente al ténnino constante y, por tanto, Xa == Ci q == 4ia , siendo ia un vector Tx I de unos. El estimador de Mínimos Cuadrados Generalizados de ]J, que pasa a ser un parámetro, y el vector de residuos anuales tienen las expresiones siguientes: A == [,TCTy I CI J-1 i T CTV-1 p lq a q q a Ya 1 • T -]. I T -1 '" 4 [la V a lal ia VaYa [3.2] obtenidas a partir de sus expresiones generales en [A2.10]. La aplicación del método de Chow y Lin (1971) depende de la estructura estocástica supuesta para el ténnino de error del modelo de regresión trimestral que lo fundamenta. En este trabajo se estudian las tres estructuras consideradas en la metodología de la CNT, que son ruido blanco, AR( t) Y paseo aleatorio condicionado, porque en INE (1993a) no se específica la utilizada para estimar la CNT, Considerar una 11 otra posibilidad afecta a la fonna de las matrices de covarianzas de los ténninos de error trimestral y anual, Vq y Va. incluidas en las expresiones [3.11 y [3.2]. Por tanto, se estiman tres tipos de series trimestrales, que son el resultado de la aplicación de tres 11 métodos diferentes, según la estructura considerada para el término de error trimestral. Estos métodos se identifican con tres letras, las dos primeras son SI (sin indicador) y la tercera es R, A ó p, para distinguir estructura ruido blanco, AR( 1) o paseo aleatorio condicionado. En adelante, las series trimestrales estimadas con cada método propuesto se identifican con el nombre del mismo, es decir. SIR, SIA y SIP, respectivamente. 3.1 MétOdo Sin indicador Ruido Blanco La estructura ruido blanco se propone en Chow y Lin (1971). Las matrices de covarianzas trimestral y anual son V q '" ¿ZI y Va'" a2CCT. Por tanto, se verifica: 1 T ,,[ T T" =-C(y -4i")=-Cy -Ci" 4 a at-' 4 a al-' [331 donde y* es un ·.vector 4Txl foonado por los vectores 4xl y; (t = 1, 2, ... , 1) de expresión: t = 1.2, .. ] [3A] en la que Ya" es el dato agregado correspondiente al año t. Sustituyendo {3.3J en {3,1 J se obtiene la expresión del estimador de una variable SIR [3.51 que presenta un salto cada cuatro observaciones, resultado de la distribución del dato anual de fonna idéntica entre sus cuatro trimestres. Esto ofrece una aproximación muy inadecuada a la variable de CNT correspondientl: en todos los casos, por lo que se concluye que el INE no emplea este método 3.2 Método Sin Indicador AR(1) Con la estructura AR(l), las matrices de covarianzas trimestral y anual son Vq '" a 2R, véase expresión (A2.l3], y Va = CJ2CRCT, que dependen del parámetro desconocido cjJ. Esta estructura se 12 sugiere en Chow y Lin (1971), donde se propone un método iterativo para estimar cjJ. Sin embargo, en Femández (1981) se indica que este método no garantiza la consistencia del estimador de cjJ obtenido en un contexto de distribución de series anuales en trimestrales o mensuales. A pesar de este inconveniente, se realiza la estimación de cjJ del ARO) trimestral utilizada en la construcción de cada variable SIA en las fases siguientes: (1) a partir de un valor de ! p ! < 1, que es el parámetro del AR(l) que se supone para el ténnino de error anual, se resuelve la ecuación polinomial propuesta en Chow y Un (1971), p. 375, para obtener $ h, donde h indica el número de iteración, (2) con $ h se estima V: y, por tanto, V:' con la que se obtiene p h Y el vector de residuos anuales íi:, a partir de sus ecuaciones en [3,2}, (3) se estima ph del modelo AR(l) especificado para o: y (4) se vuelve al paso (1) hasta alcanzar un criterio de convergencia prefijado. Lo más destacable de la aplicación de este método es que la estimación de q, es muy elevada (mayor que .95), rozando no estacionariedad en algunos casos, con independencia del valor inicial del parámetro p. Esto puede convertir la estructura del término de error trimestral en un paseo aleatorio. Con la estimación final de cjJ se obtiene la matriz ii. Sustituyendo en [3.1 J la estimación final del parámetro ~ y la matriz R, se obtiene la expresión del estimador de una variable SIA: [3.6] Las variables SIA, aunque superan los inconvenientes de las variables SIR. muestran discrepancias con sus análogas de CNT. mayores al inicio y al final de la muestra, Por tanto, se concluye que el INE tampoco utiliza este método. 3.3 Método Sin indicador Paseo Aleatorio Condicionado En Femández (1981) se presenta un método de desagregación temporal, basado en especificar una función cuadrática de la diferencia entre la variable trimestral a construir y una combinación lineal de los indicadores seleccionados: 13 [371 4. EVALUAC[ÓN DEL MÉTODO SIN INDICADOR PASEO ALEATORIO CONDICIONADO donde F es una matriz 4Tx4T simétrica y no singular. La minimización de [3.7), restringida a que la Cuando una serie SIP no coincide con su análoga de CNT es razonable suponer que para estimar suma de las cuatro estimaciones trimestrales de un año es igual al dato anual observado, proporciona ésta, además de la serie de CNA oportuna. se utiliza información de indicadores. Por tanto, interesa los estimadores de Yq y de p. descubrir si una serie de CNT capta información útil no anual o es el resultado de la manipulación de Una aplicación de este enfoque consiste en minimizar la diferencia al cuadrado entre las primeras la serie de CNA correspondiente con un método de distribución. En concreto, para evaluar la diferencias de la serie a consnuir y de los indicadores, respectivamente. La matriz F = DTD, donde aproximación de cada serie SIP a su análoga de CNT, se construyen las variables E. D, definida en la expresión [A2, 14), sirve para convertir los valores de Yq e iq a su primera diferencia, excepto el primer elemento que no varía. 4.1 Aproximación a las variables de Contabilidad Nacional Trimestral Con esta aplicación se generaliza el caso propuesto por Denton (1971) en el que se considera un Para ilustrar el error de aproximación de una serie SIP a su análoga de CNT, se calculan las s610 indicador y el parámetro P '= 1, Además, se obtienen los mismos estimadores de ~ e Yq que al variables E, EYq,l = ln(yq,! I y:~p) (1 '= 1,2, . ., 4n, cuya desviación típica estimada es crEy ' aplicar Chow y Lin (1971) bajo el supuesto de que el ténnino de error trimestral tiene estructura de En los trimestres donde las series SIP y CNT coinciden, la correspondiente variable E tiene paseo aleatorio, con la condición de que es nula la perturbación trimestral del último trimestre del año valores nulos. Si coinciden en toda la muestra, además, su & Ey = O, como sucede con EYG, EQA Y precedente al primer año de la muestra considerada. EYSN de la revisión IV/92, Si se aplicara esta observación a cualquier variable E, se esperaría que Bajo el supuesto de paseo aleatorio condicionado, las matrices de covarianzas trimestral y anual cuanto menor fuera el valor de su a Ey' menor sería la información no anual utilizada para estimar su son V q '" ifCDTDr 1 y Va = (J2C(DTDf leT. Además, si no se utiliza ningún indicador, la matriz de correspondiente serie de CNT. Sin embargo, como se explica a continuación, las variables E no indicadores es X q '" iq' Estas consideraciones delimitan el procedimiento SIPo Al particularizarlas en contienen sólo la información que los indicadores empleados aportan a las series de CNT oportunas. la expresión [3.1], se obtiene el estimador de una variable SIP: Las variables E presentan el gráfico temporal bien centrado, la media muestral nula y una estructura AR(2) con raíces imaginarias. Esta estructura aparece aunque la discrepancia entre las series [3.81 SIP y CNT sea mínima en número de valores y magnitud, lo que hace sospechar que no es El método SIP se aplica a la distribución de las series de CNA de las revisiones 1992 y 1995, con infonnación aportada por indicadores, sino resultado del método de distribución empleado. Además, el fin de comparar y verificar los resultados obtenidos. Se construyen variables SIP para las 25 algunas variables E presentan valores extremos muy grandes al final o al principio de la muestra, que variables de CNT 'l;ye se investigan explícitamente. Los resultados principales de esta aplicación son' '~ aportan una parte importante a su crEy , p.e. crEYTE pasa de 106% a 46% cuando se quitan los (1) en la revisión r\1/92, las series SIP y CNT son idénticas para YG, QA e YSN, y casi exactas en YTI. trimestres de 1992. QTl Y YTE, (2) en la revisión IV/95, las series SIP y CNT coinciden en la submuestra I170~IV/86 para Por tanto, en cr Ey se distinguen dos componentes aportados por la estructura AR(2) con raíces las variables flujo de las triadas A, SN, TI y TE, Y (3) en ambas revisiones, las series SIP y CNT imaginarias y la información exclusiva de indicadores, respectivamente. En algunos casos, valores coinciden para las variables: (i) YNI e YNC, en la submuestra I/70-IVI74, (ii) Y/C (sólo en la reviSión extremos del final o del principio de la muestra aportan un tercer componente. En este sentido, las IV/92) y QNC, en los trimestres l/70-IVI73, y Oií) YSV, en las observaciones de I/70~IV177 14 15 variables E pueden ofrecer una aproximación sobreestimada de la infonnación de indicadores captada en la estimación de las series de CNT. 4.2 Interpretación de resultados La observación de las variables E ofrece las conclusiones resumidas a continuación. (1) En la parte de la muestra donde una serie de CNT presenta tramos aproximadamente constantes de cuatro valores en V21n, no se utilizan indicadores para su estimación. (2) Las variables flujo de las triadas G, A, SN, TI y TE de CNT se estiman sin información útil de indicadores. De hecho, sus series SIP y CNT son idénticas o casi exactas en la revisión IV /92, aunque presentan discrepancias a partir del l/87 en la revisión IV/95, véase p.e. EQA en Figura 4.1. Estas discrepancias pueden deberse a las revisiones de las series de CNA oportunas y/o a la nueva información de indicadores utilizada desde l/87. Pero la última causa no parece razonable porque hay indicadores potenciales antes de dicha fecha para G, A Y SN, aunque de cobertura y fiabilidad dudosas a juicio de Alvarez (1989), y no existen indicadores documentados para TI y TE, (3) La información de indicadores incorporada en la estimación de las variables de CNT no es homogénea entre diferentes revisiones, véanse p.e. EQSN de las revisiones IV/92 y IV/95 en Figuras 4.2 Y 4.3. Esto sugiere un aspecto negativo para su empleo en aplicaciones econométricas. (4) Las series EYC y EQC, véase Figura 4.4, muestran las mismas propiedades y configuraciones gráficas que YC y QC, respectivamente. Es destacable una estructura anual no estacionaria, que se puede interpretar como una desestacionalización inadecuada de los índices sintéticos empleados. (5) Las variables flujo de Producción, salvo dos excepciones, se estiman sin indicadores al menos en una submuestra ¡picial, donde sus variables E tienen valores nulos, veánse p.e EYNC y EQNC en Figuras 4.5 y 4.6. :~sto indica que presentan una evolución temporal no homogénea y confirma la apreciación de Martín (1991) relativa a las limitaciones en disponibilidad y cobertura de indicadores para Valor Añadido Bruto. Además, es de esperar que en cada triada la variable Y incorpore al menos los mismos indicadores que la variable Q. teniendo en cuenta la identidad que las relaciona. Pero esto no sucede siempre, como se observa en el ejemplo indicado. 16 , , 2 v V ,. -2 -6~~~~~~=-=-=-~~~~ 70 72 74 76 78 80 82 84 86 88 90 92 94 :::~ o ......... :., .. ·1.····· --.~. ' ". 0,29 '., -•. - -. _. T , , 0,.57 . , 4 8 12 Figura 4.1: Serie EQAq,r tipificada (II70·IV/95) (w = 0.00%(0.01 %), o-w ::= 0.15%) y sus aif (Q( 15) ::= 97,8) Y pacf· -,~~~~=-~~~~~~~~ 70 72 74 76 78 80 82 84 86 88 90 92 94 0.50 1 01:;'1 1 _l'''' ':,. ". l.: n "'1 !jI l.' .:'1' 050_ , , ":f,',I¡Ii'U' IT",I. " .. '. O. 25 t··· ',' , .. ' ., ... ", + ... 050· 4 B '2 Figura 4.2: Serie EQSNq,r tipificada (1170-IV/92) (w ::= 0.00%(0.03%), Ó-w ::= 0.27%) y sus acf (Q(l5) ::= 66.8) y paif· 8 6 -8~~~~~~=-~~~~~~ 70 ~2 74 76 78 80 82 84 86 88 90 92 94 :::¡"j, .. :::~ 4 8 12 OAO, .......... +- ¡Iirl;lll~' ' , " Figura 4.3' Serie EQSNq. 1 tipificada (II70·IV/95) (w ::= 0.00%(0.01 %), aw = 0.05%) Y sus acJ (Q(15) = 45.4) Y pacf· 17 5. CONCLUSIONES , 2 G O :::~'_._------_ .... _----- •. -. G 32 ' " - •• """ - - O_54 4 S 12 La investigación de los aspectos técnicos y empíricos relacionados con la información de indicadores utilizada en la construcción de la CNT, ofrece resultados, resumidos a continuación, que es aconsejable dar a conocer a los usuarios potenciales de la misma. 1 -2 t -, -,L-______ ~ ________ ~ ____ __ :::~---1,· ---+_-o ' ' , 032 - - - - -- ---)- 0_641 ' 4 8 '2 La aplicación de forma automática de técnicas de análisis univariante y desestacionalización, y el empleo del método de Chow y Lin (1971) basado en supuestos arbitrarios e injustificados empíricamente, originan: (1) que las series de CNT presenten estructuras ARMA con parámetro de 70 72 74 76 78 Be 82 84 86 88 90 92 media móvil negativo, poco frecuente en series económicas, (2) que las variables flujo de Consumo Figura 4.4: Serie EQCq. 1 tipificada (w =: 0.00%(0.06%), Uw = 0.54%) Y sus aef(Q(l5) = 94.2) Y paef. Privado Nacional, principal componente del PIB en Gasto Agregado, muestren una estructura anual :::Nt· ·1·". 0.33 . . :- 066 . . no estacionaria, que resulta llamativa en series trimestrales elaboradas con índices desestacionalizados, 2 y (3) que algunas variables de CNT presenten configuraciones gráficas peculiares, relacionadas con la falta y/o la escasez de indicadores en su estimación. 4 8 '2 0t-----~~4++H~~~4+~~~A v~ -,L......I...,..........._~~~ 70 72 74 ,'6 78 80 82 84 86 88 90 92 La comparación de las series de CNT con las series trimestrales construidas, aplicando la :::~I ... _ ..... : .......... : ... _ ........ ~--.... --. o . ! 033 1 . - ....... . 0.66 , 4 8 12 metodología utilizada por el lNE para estimar la CNT y sín índicadores. permite detectar: (1) que la estructura de paseo aleatorio condicionado para el término de error trimestral parece ser la empleada por el INE para estimar la CNT, (2) que las variables de CNT de Producción, salvo alguna excepción, -2 --------- _____ ~ ___ _ Figura 4.5: Serie EYNCq,1 tipificada (w =: -0.01 %(0.10%), o-w = 0.99%) Y sus aif(Q(I5) = 121.7) Y pacf· y algunas de Gasto Agregado, se construyen sin incorporar información útil de indicadores en toda o parte de la muestra, y (3) que la información de indicadores utilizada en la estimación de la mayoría .:.::~ílllli'Y 4 8 12 de las variables de CNT difiere sustancialmente entre distintas revisiones. Por tanto, las variables de CNT, aunque presentadas como datos, contienen una parte importante JI de modelos que no se pueden verificar por no ser explícitos, y tienen diferente valor respecto a su -4L-______ ~ ______________ __ :::~; ...... . ,,: ...11:. . o 6J : . ; 4 8 '2 contenido en información útil de indicadores. ro '2 74 76 78 80 82 84 86 88 90 92 Figura 4.6: Serie EQNCq,¡lipificada (w = 0.00%(0.06%), Úw = 0.54%) Y s,us aef(Q(15) = 141.8) Y pacf· lB 19 " APÉNDICE A1. MNEMOTÉCNICOS, IDENTIDADES Y DATOS DE LA CONTABILIDAD NACIONAL TRIMESTRAL Mnemotécnicos El elevado número de variables de CNT requiere un sistema de mnemotécnicos para facilitar su referencia y manipulación. Cada variable se nombra con dos o tres letras: (1) la primera, que puede ser Y, Q ó P, indica una variable en pesetas corrientes, en pesetas constantes de 1986, ambas son variables flujo, 6 un deflactor implícito con media 100.0 en 1986, respectivamente, y (2) las segunda y tercera, que aparecen entre paréntesis junto a cada variable del Cuadro Al!, indican el componente de Gasto Agregado y de Producción, respectivamente Las variables de CNT y sus análogas de CNA tienen los mismos mnemotécnicos. Cuando es imprescindible distinguir en una misma variable de eN la serie trimestml de la anuaL se utilizan los subíndices q y a para identificarlas, p.e. QCq y QCa, Cuadl'O AL1: Mnemotécnicos de las variables de CNT GASTO AGREGADO Co~sumo Privado Nacional (c) Consumo Público (G) Fonnación Bruta de Capital Fijo. Total (T): Bienes de Equipo (lB) Construcción (lC) Variación de Existencias (VI Demanda Interna (D) Exportaciones de Bienes y Servicios (X) Importaciones de Bienes y Servicios (E) PRODUCCIÓN Valor Añadido Bruto a precios de mercado Ramas Agrícola y Pesquera (A) Ramas Industriales. Total (N): Industria excepto Construcción (Nf) Construcción (Ne) Ramas de Servicios. Total (S): Servicios destinados a la venta (SV) Servicios no destinados a la venta (SM Impuesto sobre el Valor Ailadido que grava los productos (TT) Impuestos netos ligados a la importación (TE) Producto Interior Bruto a precios de mercado (l') Por tanto, del PIB y de cada uno de sus componentes hay tres tipos de variables, p.e. YNl, QNl y PNl son Producción Industrial medida en pesetas corrientes, en pesetas constantes de 1986 y su deflactor implícito, respectivamente 20 ., Identidade. Las variables de CNT se organizan en una estructura en la que se distinguen tres tipos de identidades contables: (t) En Gasto Agregado, las variables flujo del PIS se descomponen en las identidades: [Ain [Ai2] y en Producción, las identidades análogas son: [A1.31 [AI.4J (2) Las variables flujo de las triadas de Inversión, Industria y Servicios se desagregan en la suma de dos componentes, según las identidades siguientes: [A15] [A1.6j [Al. 7J IAI.8J [AI9] IAl.!OJ (3) Las triadas son grupos integrados por las variables Y, P Y Q del PIB y de cada categoría de Gasto Agregado y de Producción. La identidad de una triada representativa wes: [Al.! Il Datos Se utilizan las series de CNT de la primera versión y de la última revisiÓn al cierre de este trabajo, muestras lJ70-IV/92 y lJ70-IV/95, respectivamente, publicadas en INE (1993b Y 1996). 21 APÉNDICE A2: DISTRIBUCiÓN DE SERIES ANUALES Dados los T valores anuales de una serie flujo anual y los 4T valores trimestrales de los indicadores, la distribución consiste en estimar los valores trimestrales no observados de la serie flujo anual, de fonna que verifiquen que la suma de las cuatro estimaciones trimestrales de cada año sea igual al dato observado para el año. El procedimiento para obtener el estimador de una serie trimestral, explicado a continuación, toma como referencia básica el método de Chow y LiD (1971). Se supone que existe una relación entre la serie trimestral no observada Yq y un conjunto de k indicadores observados, xl' x2> ••• , xk' expresada en el modelo lineal de regresión' IA2.11 donde Y q • x¡, x2' .. , xk son vectores 4ThI, X q '" (Xl x2 ·· xk) es una matriz 4Txk y uq es un vector aleatorio 4Txl, con vector de esperanzas matemáticas Oq y matriz de covananzas V q' Sea e una matriz de transfonnación Tx4T, que pemite agregar los 4T datos trimestrales en T datos anuales, cuya definición es: fA2.2] donde 1 es la matriz identidad TxT e iT es un vector fila I x4 de unos. Premultiplicando el modelo [A2.11 por C, se obtiene el modelo de regresión lineal con datos anuales: [A2.3] en el que Ya '" Cyq, Xa '" CXq, Ua = CUq y Va'" CV qCT . y donde se observa que ~ es invariante a la transfonnación,lexcepto el coeficiente correspondiente al término constante . .(! ''-1 El objetivo es'>estimar de manera lineal, ¡nsesgada y eficiente, el vector Yq de 4T observaciones trimestrales de la variable dependiente en el periodo muestral T. Un estimador de Y q es lineal si para alguna matriz A de orden 4TxT verifica: [AH] 22 ., Además, es insesgado cuando cumple: [A2.5] lo que se verifica sólo si: [A2.6j Las condiciones lA2A] y [A2.6] implican que y q - Y q = A u a - u q' Por tanto, la matriz de covananzas del error de estimación es: El mejor estimador lineal e ¡nsesgado de Yq se obtiene al minimizar la traza de la matriz de covarianzas fA2.71 respecto a A, bajo la condición de insesgadez de [A2.6]. La solución para A es: que al sustituirla en la expresión [A2.41 permite obtener el estimador de la variable Yq: [A291 siendo: IA2.1O] donde p es el estimador de Mínimos Cuadrados Generalizados y fi a es el vector de residuos del modelo con datos anuales fA2.3]. Las series trimestrales obtenidas aplicando el estimador {A2,9] verifican que la suma de los cuatro datos de un año es Igual al dato anual observado: eyA -CX A. +CV CTV-1u =xnA. +íL=yo q - ql-' q a a ,,1-' " .. [A2.JI] La aplicación de Mínimos Cuadrados Generalizados requiere el conocimiento de la matriz de cuvarianzas V q' En la práctica, Vq es desconocida y se estima suponiendo alguna estructura para el 23 término de error de la regresión trimestral [A2.1 J, Las principales alternativas son: ( ¡) Ruido blanco, planteado en Chow y Lm (1971). Las matrices de covarianzas de los términos de error trimestral y anual son V q == a 2I y Va = a2CC T. (2) ARO), sugerido en Chow y Lin (1971), según la expresión: 1'" 1.2, AT [A2.121 La matriz de covarianzas del término de error trimestral es: )~ ~ ~2 tjl4T-l '" a 2 :E ~ ~4T-2 a2 :E = a 2R [A2131 Vq " " l~4T (1 _ ~2 1 I 1\l4T"2 1\l4T-3 y, por tanto, la del término de error anual es Va'" a2CRC T (3) Paseo aleatorio condicionado, propuesto en Fernández (1981). Las matrices de covarianzas de los términos de error trimestral y anual son Vq '" d2(DTD)-l y Va'"