Estadística 1

Independencia. Estadística descriptiva. Caracterización de series de frecuencias. Medidas de posición, dispersión y defo
831KB Größe 15 Downloads 43 Ansichten
Estadística 1 Lic en Turismo, Hotelería, Administración o Economía

Profesor:

Dr. Ing. Agr. Lucas A. Garibaldi

JTPs:

Lic. Francisco J. Aristimuño Dr. Ing. Ftal. Facundo Oddi

Ayudantes:

Msc. Lic. Juliana Hipólito de Sousa,

Ing. Agr. Matías Goldenberg, Lic. Florencia Tiribelli, Luciano Minichello, Agustina Cotelo, Aliosha Behnisch.

Sede Andina Universidad Nacional de Rio Negro

Sede y localidad Carrera

Sede Andina, San Carlos de Bariloche Licenciatura en Administración, Licenciatura en Hotelería, Licenciatura en Turismo y Licenciatura en Economía.

Programa de la asignatura Asignatura: Estadística I Año calendario: 2015

Cuatrimestre: Primer cuatrimestre del

Carga horaria semanal: seis (6) horas

segundo año. Créditos:

Carga horaria total: 96hs Horas semanales de consulta: 6 (en aulas regulares de teóricos y prácticos) Horas de estudio recomendadas (extra clase): 8 Profesor:

Email:

Dr. Lucas A. Garibaldi

[email protected]

Auxiliar:

Email:

Dr. Facundo Oddi

[email protected]

Lic. Francisco J. Aristimuño

[email protected]

Programa Analítico de la asignatura Contenidos mínimos establecidos por Plan de Estudio: Introducción a la estadística. Experimentos aleatorios. Probabilidad. Tipos de definiciones. Probabilidad total, condicional y Teorema de Bayes. Independencia. Estadística descriptiva. Caracterización de series de frecuencias. Medidas de posición, dispersión y deformación. Variable aleatoria. Momentos. Función de probabilidad y densidad. Distribución de probabilidad. Distribución conjunta y marginal. Independencia, covarianza y correlación. Distribuciones de probabilidad comúnmente usadas. Teorema central del límite. Muestreo: concepto. Error muestral. Procedimientos muestrales. Estimadores: concepto y propiedades generales. Ley de los grandes números. Distribuciones de estimadores para muestras aleatorias simples. Inferencia estadística. Estimación puntual. Estimación por intervalos de confianza. Test de Hipótesis. Bondad de ajuste. Tablas de contingencia. Análisis de Varianza. Números índices. Tipos y propiedades de números índices. Deflactores de precios. Regresión lineal: estimación por mínimos cuadrados. Supuestos del modelo. Series de Tiempo. Tendencia. Variaciones cíclicas. Variaciones estacionales. Variaciones aleatorias. Creada por Ley 26.330 /Colón 450 Oficina 1 .CP 8500 Viedma. Río Negro / [email protected] /www.unrn.edu.ar

Aplicaciones informáticas. Objetivos de la asignatura: La presente materia es de indudable importancia para los futuros graduados. En efecto, el entorno global pleno de incertidumbre en el que se desempeñan nuestras empresas, organizaciones e instituciones, requiere que la toma de decisiones contemple de la forma más acabada posible la evaluación del riesgo. Así, la estadística les brinda a los alumnos uno de los instrumentos de utilidad práctica y aplicación experimental más valiosos de la caja de herramientas que provee la licenciatura. Como asignatura introductoria, combina la enseñanza de conceptos básicos de probabilidad y estadística y variables aleatorias, con herramientas de inferencia con sólida fundamentación teórica sobre el comportamiento de dichas variables. De este modo, se procurará como objetivo general facilitar las herramientas esenciales que aporta la estadística para el análisis del riesgo, la incertidumbre y la toma de decisiones, buscando que el alumno adquiera el marco teórico de la materia y desarrolle capacidad de aplicación de la misma a la realidad. Se plantean como objetivos particulares que el alumno logre: 

Comprender la importancia y la inserción de la materia en su ámbito profesional.



Plantear, validar e interpretar modelos estadísticos para contestar preguntas aplicadas a partir de datos.



Confeccionar e interpretar de forma clara figuras con información estadística.



Manejo de software estadístico.

Propuesta Metodológica de la asignatura: En este curso la teoría estadística se introduce a partir de la discusión de problemas del ámbito profesional que motiven al estudiante. Se pone especial énfasis en la utilidad de los conceptos estadísticos para reducir la incertidumbre y tomar mejores decisiones profesionales. Las clases se desarrollan utilizando datos reales con los que se contestan preguntas profesionales a partir de modelos y conceptos estadísticos. Parte del curso se desarrolla en aula de informática utilizando el ambiente de programación R, en particular el paquete "R commander", de código abierto y uso gratuito. Forma de aprobación: Promocional (calificación requerida) / No promocional: Asistencia: para alcanzar la condición de regularidad es necesario que el alumno alcance una asistencia del 75%, tanto en las clases teóricas como prácticas. Evaluación: la evaluación del curso consiste en un examen integrador al final del curso de duración de 3 horas (40% nota final) y varios exámenes integradores cortos y trabajos prácticos durante el curso (60% nota final). El examen final se desarrollará en aula de informática con R commander. Regularización: alcanzará dicha condición el alumno que cumpla con al menos un 75% de asistencia (tanto a clases como a exámenes) y posea una nota promedio igual o mayor a 5. Promoción: alcanzará dicha condición el alumno que cumpla con al menos un 75% de Creada por Ley 26.330 /Colón 450 Oficina 1 .CP 8500 Viedma. Río Negro / [email protected] /www.unrn.edu.ar

asistencia (tanto a clases como a exámenes) y posea una nota promedio igual o mayor a 7.

Unidad I: El papel de la estadística y descripción de los conjuntos de datos Número de clase: 1-2 Contenidos: Rol de la estadística. Preguntas y datos. Variables, tipos de variables y escalas de medición. Incertidumbre y sus causas. Población, muestra y unidad experimental (muestral). Tamaño de la muestra. Parámetros y estadísticos. Diseño de estudios (muestreo), estadística descriptiva y estadística inferencial. Error de muestreo. Sesgo de muestreo. Distribución de frecuencias. Frecuencias absolutas y relativas. Frecuencias acumuladas crecientes y decrecientes. Tablas de frecuencia y de contingencia. Histograma. Ojiva. Datos de corte transversal, datos de serie de tiempo, datos en panel. Mapas conceptuales. Aplicaciones informáticas. Bibliografía obligatoria de la Unidad: Webster A. L. (2000) Estadística aplicada a los negocios y la economía. 3era edición. Ed. Irwin McGraw-Hill. Capítulos 1 y 2. Bibliografía complementaria de la Unidad: Anderson D. R., Sweeney D. J. y Williams T. A. (2011) Estadística para administración y economía. 11a edición. Ed. Cengage Learning. Capítulos 1 y 2. Arriaza Gómez A. J., Fernández Palacín F., López Sánchez M. A., Muñoz Márquez M., Pérez Plaza S., Sánchez Navas A. Estadística Básica con R y R-commander. 2008. Servicio de Publicaciones de la Universidad de Cádiz. http://knuth.uca.es/ebrcmdr

Unidad II: Medidas de tendencia central, de dispersión, de asimetría y de curtosis Número de clase: 3-6 Contenidos: Media, mediana, moda. Cuantil, cuartil, decil, percentil. Diagrama de caja y bigotes. Amplitud intercuartilar. Rango. Desvío Estándar y Varianza. Coeficiente de variación. Asimetría y curtosis. Aplicaciones informáticas. Bibliografía obligatoria de la Unidad: Anderson D. R., Sweeney D. J. y Williams T. A. (2011) Estadística para administración y economía. 11a edición. Ed. Cengage Learning. Capítulo 3. Webster, A. L. (2000) Estadística aplicada a los negocios y la economía. 3era edición. Ed. Irwin McGraw-Hill. Capítulo 3. Bibliografía complementaria de la Unidad: Arriaza Gómez A. J., Fernández Palacín F., López Sánchez M. A., Muñoz Márquez M., Pérez Plaza S., Sánchez Navas A. Estadística Básica con R y R-commander. 2008. Servicio de Creada por Ley 26.330 /Colón 450 Oficina 1 .CP 8500 Viedma. Río Negro / [email protected] /www.unrn.edu.ar

Publicaciones de la Universidad de Cádiz. http://knuth.uca.es/ebrcmdr

Unidad III: Principios de probabilidad y experimentos Número de clase: 7 - 10 Contenidos: Tablas de contingencia y Tablas de probabilidad. Definición y modelo clásico. Frecuencia relativa y probabilidad. Probabilidad marginal, conjunta y condicional. Uniones, intersecciones y relaciones entre eventos. Eventos complementarios. Eventos independientes. Experimentos aleatorios. Variable aleatoria. Experimentos mensurativos y manipulativos. Experimento, muestreo y espacio muestral. Adición y multiplicación de probabilidades. Combinaciones y permutaciones. Teorema de Bayes. Aplicaciones informáticas. Bibliografía obligatoria de la Unidad: Anderson D. R., Sweeney D. J. y Williams T. A. (2011) Estadística para administración y economía. 11a edición. Ed. Cengage Learning. Capítulo 4. Webster, A. L. (2000) Estadística aplicada a los negocios y la economía. 3era edición. Ed. Irwin McGraw-Hill. Capítulo 4. Bibliografía complementaria de la Unidad:

Unidad IV: Distribuciones de probabilidad discretas y continuas Número de clase: 10 -16 Contenidos: Distribuciones discretas y continuas. Probabilidad y densidad de probabilidad. La distribución normal y la regla empírica. Distribución normal estándar. Distribución binomial. Distribución Poisson. Distribución uniforme. Distribución hipergeométrica. Distribución exponencial. Bondad de ajuste. Aplicaciones informáticas. Bibliografía obligatoria de la Unidad: Anderson D. R., Sweeney D. J. y Williams T. A. (2011) Estadística para administración y economía. 11a edición. Ed. Cengage Learning. Capítulos 5 y 6. Webster, A. L. (2000) Estadística aplicada a los negocios y la economía. 3era edición. Ed. Irwin McGraw-Hill. Capítulo 5. Bibliografía complementaria de la Unidad:

Unidad V: Muestreo y distribuciones por muestreo

Creada por Ley 26.330 /Colón 450 Oficina 1 .CP 8500 Viedma. Río Negro / [email protected] /www.unrn.edu.ar

Número de clase: 17 - 20 Contenidos: Valor esperado. Error de muestreo. Error estándar. Teorema central del límite. Propiedades de los estimadores. Estimador insesgado, eficiente, consistente y suficiente. Aplicaciones informáticas. Bibliografía obligatoria de la Unidad: Anderson D. R., Sweeney D. J. y Williams T. A. (2011) Estadística para administración y economía. 11a edición. Ed. Cengage Learning. Capítulo 7. Webster, A. L. (2000) Estadística aplicada a los negocios y la economía. 3era edición. Ed. Irwin McGraw-Hill. Capítulo 6. Bibliografía complementaria de la Unidad:

Unidad VI: Estimación por intervalos y tamaño de la muestra Número de clase: 21 - 24 Contenidos: Estimación puntual y por intervalos de confianza. Influencia del nivel de confianza y del tamaño muestral. Determinación del tamaño de la muestra. Distribución t Student. Aplicaciones informáticas. Bibliografía obligatoria de la Unidad: Anderson D. R., Sweeney D. J. y Williams T. A. (2011) Estadística para administración y economía. 11a edición. Ed. Cengage Learning. Capítulo 8. Webster, A. L. (2000) Estadística aplicada a los negocios y la economía. 3era edición. Ed. Irwin McGraw-Hill. Capítulo 7. Bibliografía complementaria de la Unidad:

Unidad VII: Contraste de hipótesis Número de clase: 25-28 Contenidos: Hipótesis y predicciones. Inferencia, significancia, confianza, potencia, error de tipo 1, error de tipo 2. Modelos nulos. Valor – p. Efectos del tamaño de la muestra. Comparaciones de medias. Aplicaciones informáticas. Bibliografía obligatoria de la Unidad: Anderson D. R., Sweeney D. J. y Williams T. A. (2011) Estadística para administración y

Creada por Ley 26.330 /Colón 450 Oficina 1 .CP 8500 Viedma. Río Negro / [email protected] /www.unrn.edu.ar

economía. 11a edición. Ed. Cengage Learning. Capítulo 9. Webster, A. L. (2000) Estadística aplicada a los negocios y la economía. 3era edición. Ed. Irwin McGraw-Hill. Capítulos 8 y 9. Bibliografía complementaria de la Unidad:

Unidad VIII: Correlación y regresión lineal simple Número de clase: 29-32 Contenidos: Covarianza, coeficiente de correlación de Pearson y coeficiente de determinación. Modelo clásico de regresión lineal simple y sus supuestos. Estimación de los parámetros del modelo por el método de mínimos cuadrados ordinarios. Ecuación de regresión estimada. Predicción media de la variable dependiente. Cuadrado medio del error como estimador insesgado de la varianza residual y medida de bondad de ajuste. Error estándar de los estimadores. Estimación puntual, por intervalos de confianza, por intervalos de predicción. Evaluación de los supuestos. Gráfico cuantil-cuantil, test de Kolmogorov-Smirnov (y modificación Lilliefors), Test de Shapiro-Wilk. Regresión y causalidad. Aplicaciones informáticas. Bibliografía obligatoria de la Unidad: Anderson D. R., Sweeney D. J. y Williams T. A. (2011) Estadística para administración y economía. 11a edición. Ed. Cengage Learning.. Capítulos 3.5 y 14. Webster, A. L. (2000) Estadística aplicada a los negocios y la economía. 3era edición. Ed. Irwin McGraw-Hill. Capítulo 11. Bibliografía complementaria de la Unidad: Dumrauf G. (2010) Finanzas Corporativas - Un Enfoque Latinoamericano. 2a edición. Ed. Alfaomega. Capítulo 7 (páginas 202-204).

Creada por Ley 26.330 /Colón 450 Oficina 1 .CP 8500 Viedma. Río Negro / [email protected] /www.unrn.edu.ar

Instructivo de Instalación R-commander Aquellos con Windows (Debe estar conectado a internet en todo el proceso de instalación) •

Apretan el botón “Download R 2.15.0 for Windows” en la siguiente página web http://cran.r-project.org/bin/windows/base/old/2.15.0/



Una vez descargado ejecute el archivo “R 2.15.0” y complete la instalación de R.



En el proceso de instalación elija generar un enlace de acceso directo desde el escritorio.



En este punto se ha completado la instalación de “R” ahora debemos proceder con la instalación de “R-Comander”



Abrir “R” utilizando el ícono del escritorio.



Ir a la opción de “paquetes”--> “instalar paquetes”.



Primero le pedirá que elija un CRAN mirror. Seleccione “Argentina (La Plata)”



Luego, se abrira una nueva ventana con una lista. Buscar y hacer doble click sobre “Rcmdr”.



El programa comenzará la instalación automaticamente.



Tipear en la interface de “R” la instrucción “library(Rcmdr)”. Automáticamente se ejecutará el programa. (en caso de que sean necesarios paquetes adicionales el mismo programa le preguntará si quiere instalarlos. Acceda a la instalación de todos ellos)



Seguir instrucciones del manual.

Aquellos con Linux – Ubuntu •

Click en el centro de sofwtare de ubuntu (ícono disponible en la barra de tareas).



Arriba a la derecha de la pantalla que se abre hay un sector de búsqueda, introducir palabra “R cran”.



Aparecerá “R Commander” como resultado de la búsqueda, apretar “instalar”.



El programa ya está instalado, desde aplicaciones ya pueden “correrlo”.



La primera vez que lo “corran” les dirá que faltan paquetes y si desean instalarlos, digan que “sí”, luego aparece otra pantalla a la que deben simplemente apretar “ok” y luego les pide que elijan un lugar de donde instalar los paquetes, elijan el que quieran y sigan. Tengan paciencia, la instalación lleva una hora.

Instructivo de R-commander ####¿Cómo comenzar a usarlo?###### ###a partir de la ventana de R### ################################# #Instalamos el paquete estadístico Rcmdr. #Escribimos la sentencia: library(Rcmdr) #y se abre la ventana de R commander. ########################### ###¿Cómo importar datos?### ########################### #Importar datos. La forma de ingresarlos va a depender del formato en el que tengamos guardado nuestros datos. Las opciones más simples son en .txt o en planilla de cálculo. #Ejemplo: Si tenemos los datos guardados en .txt. Vamos a la solapa Datos, a la opción Importar datos, y seleccionamos desde archivos de texto, portapapeles o URL... #Podemos escribir el nombre del conjunto de datos, cómo se indican los datos ausentes, cuál es el caracter decimal, etc. #Ingresamos el archivo del cual extraemos los datos.

#Una vez que está activo figura en la región superior de la ventana de Rcommander, el nombre del conjunto de datos en azul. #Podemos visualizar el conjunto de datos, clickeando en el botoncito que dice "visualizar conj. de datos". ######################## ###Medidas de resumen### ######################## #Para obtener distintas medidas de resumen del conjunto de datos. Vamos a Estadísticos, y después tenemos varias opciones: #La primera es Resúmenes: #Conjunto de datos activo: dá algunas medidas descriptivas de las variables que están en el archivo, como por ejemplo cuartiles, mediana, media, desvío, etc. #Resúmenes numéricos: lo podemos hacer por cada variable por separado. nos dá una medida de la media. desvio. coeficiente de variación. dá la opción de coeficientes de asimetria, cuantiles. ############## ###Gráficos### ############## #En la solapa Gráfica hay varias opciones para realizar distintos gráficos, como por ejemplo: #Histogramas: nos permite elegir el número de clases y si queremos las frecuencias relativas, absolutas, etc. #Diagrama de cajas (Gráfico de caja y bigotes).

#Una vez que hicimos el gráfico desde Rcommander, vamos hasta la ventana de R y hacemos enter para que visualizarlo. ################################################### ###Intervalos de confianza y prueba de hipótesis### ################################################### #Si queremos calcular los intervalos de confianza para la media vamos a: Estadísticos, seleccionamos la opción Medias, Test de t para una muestra, Selecionamos la variable que queremos analizar, y cuál es la hipótesis que queremos testear. En la salida vamos a tener los intervalos de confianza, #los grados de libertad, el valor p, el estimado, etc.

La notación científica es un recurso matemático empleado para simplificar cálculos y representar en forma concisa números muy grandes o muy pequeños. Para hacerlo se usan potencias de diez.

Ej:

a × 10n

a) 720.000.000.000 ( Es un número enorme y no es cómodo para trabajar con él, por ejemplo ponerlo en una tabla) 720.000.000.000 ,00 = 7,2 × 1011 (Corrimos la coma decimal “ , ” once lugares hacia la izquierda) b) 0,0000000000056 (Es un número muy pequeño y es muy incomodo trabajar con él) 0,0000000000056 = 5,6 × 10-12 (Corrimos la coma decimal “ , ” doce lugares hacia la derecha, por eso es “ -12 ”)

En la calculadora la notación científica se expresa como 7,2 E11 ó 5,6E-12 la “ E ” reemplaza al 10.