En la presente investigación matemática investigaré sobre la aplicación de la estadística descriptiva e inferencial en una evaluación psicológica de la significatividad del ambiente en la autoestima aplicada a los estudiantes del segundo año del programa del diploma de México y Perú, pertenecientes a una clase social media alta.
Para realizar la siguiente evaluación se usó como referencia el estudio “La lucha por el reconocimiento y la estima” de Caroline Howarth 2002, en el cual se realizaron grupos de trabajo entre los estudiantes de Brixton. Realizándoles una serie de preguntas en tres diferentes secciones, evaluando como es que su cultura influenciaba su reconocimiento y autoestima debido al colegio en el que se encontraban (Howarth, 2002).
Tomando esto en cuenta, mi motivación principal respecto al desarrollo de esta exploración surge a partir de mi interés por la psicología, actualmente es una parte primordial de la carrera que voy a estudiar, me impulsa a conocer más sobre la estadística desde un ámbito psicológico. Asimismo, también por mi fascinación de como la cultura en la que vivimos, rodeado de prejuicios y estereotipos, influencia nuestra autoestima.
Consecuentemente, el objetivo de la exploración es evaluar si existe una correlación positiva entre el ambiente y el nivel de autoestima, mediante la aplicación de pruebas y coeficientes estadísticos a partir de las puntuaciones obtenidas de las encuestas aplicadas. Así como también, determinar si la influencia del ambiente en la autoestima es más significativa en los estudiantes del segundo año del diploma de México, a comparación de los estudiantes del segundo año del diploma de Perú.
A partir de esto realizaré un cuasi-experimento, en el cual se escogen grupos experimentales ya formados. Para hacer esto, utilizaré un muestreo no probabilístico en donde los sujetos se eligen para conformar un grupo específico, partiendo de un diseño cuasi-experimental con las siguientes variables -
Variable independiente (cualitativa ordinal) - El ambiente
Variable dependiente - El nivel de autoestima
Para ello, primeramente, aplicaré una encuesta utilizando un cuestionario de elaboración propia (ver Apéndice 1) a 40 estudiantes del segundo año del diploma, entre ellos 20 estudian en México y 20 estudian en Perú. El cuestionario está conformado por las tres secciones utilizadas en el estudio referente, las cuales son la construcción de identidades sociales a través de representaciones, ilustra cómo se construye la identidad a través y en contra de las representaciones que tienen otros dentro de contextos sociales particulares; la violencia psicológica en las representaciones estigmatizantes, la cual examina el costo que puede tener la cultura en la autoimagen y autoestima en los estudios; y las relaciones sociales y culturas institucionales en el empoderamiento, esta muestra cómo algunos adolescentes desarrollan en colaboración de los recursos sociales y psicológicos para protegerse de los prejuicios de los demás.
En segundo lugar, habiendo obtenido los resultados de la encuesta, los ordenaré en dos tablas para posteriormente tomarlos en cuenta en cálculos estadísticos. Después, hallaré el Coeficiente Alfa de Cronbach de ambos grupos para medir la confiabilidad de los datos del cuestionario aplicado. Luego de ello, hallaré los resultados del test deShapiro-Wilk para evaluar la normalidad de la muestra y así determinar que prueba de hipótesis usar. Seguidamente, realicé la campana de gauss acorde a mis datos obtenidos para graficar la normalidad de la muestra. Asimismo, hallaré el coeficiente de correlación de Pearson para poder observar la relación entre el ambiente y la autoestima. A partir de esto, aplicaré la prueba de hipótesis T de Welch-Satterthwaite para dos muestras independientes con varianzas heterogéneas. Por último, para poder tener un mayor sustento bajo otra perspectiva, en este caso una cualitativa, categoricé las puntuaciones de la encuesta para poder realizar la prueba de Chi cuadrado. Finalmente, a partir de todo lo mencionado determinaré si la autoestima influenciada por el ambiente es más significativa en los estudiantes del segundo año del diploma de México en lugar de los de Perú.
Previamente al desarrollo de la exploración aclararé algunos conceptos -
Ambiente
En este estudio el ambiente se entiende como las características del entorno que rodean al individuo, en este caso se considera el estatus social, familiares, amigos, el entorno en el que estudia y se desarrolla, su nivel económico, la actitud y prejuicios de las personas cercanas a su entorno, etc. Estos factores que representan el ambiente son los que generan los distintos niveles de ansiedad, presión social, estrés, entre otros, en el individuo.
Coeficiente Alfa de Cronbach
El Alfa de Cronbach es el promedio de las correlaciones entre los ítems que son parte de un instrumento, por medio del análisis del perfil de las respuestas (Dacto, Vaca y Reinoso, 2017). Este se usa para medir la confiabilidad de una escala tomando en cuenta la consistencia interna de un conjunto de ítems. La confiabilidad se refiere al grado en el que se presentan errores de medición ante el uso de la prueba y la consistencia interna hace referencia a homogeneidad, conocer hasta qué punto se está evaluando al constructo, y el grado de interrelación de los resultados de los ítems.
Test de Shapiro-Wilk
La prueba de Shapiro-Wilk es capaz de detectar desviaciones de la normalidad debido a la asimetría, la curtosis, o ambos. La cual se restringe originalmente a un tamaño de muestra menor a 50, además tiene buenas propiedades enérgicas, dada a la muestra aleatoria ordenada (Mohd y Bee, 2011). Es útil para determinar el uso de una prueba paramétrica o no paramétrica dependiendo en el tipo de desviación que se obtenga. En el caso de la normal, los valores se acercan más a la media y en la no normal, los datos se distribuyen de manera más dispersa.
Coeficiente de Correlación de Pearson
El Coeficiente de Correlación de Pearson es una prueba paramétrica que mide el grado de covariación entre distintas variables relacionadas linealmente. Sus valores oscilan entre -1 y +1, en donde la magnitud de la relación viene especificada por el valor numérico del coeficiente (Hernández, 2018). Su cálculo permite conocer exactitud el grado de dispersión de los valores de una variable en relación con una media para dicha variable, en otras palabras, mide el grado de relación que tienen entre ambas variables.
La prueba T de Welch-Satterthwaite
La prueba de hipótesis paramétrica, T de Welch-Satterthwaite para dos muestras independientes con varianzas heterogéneas, es un estimador complejo de varianza como una combinación lineal de cuadrados medios independientes (Moreno y Ortiz, 2011). En esta prueba los grados de libertad resultan ser aleatorios, pues son función de la muestra.
Test de Chi cuadrado
La prueba Chi cuadrado permite determinar si dos variables cualitativas están asociadas o no. Si se concluye que las variables no están relacionadas se puede decir con un determinado nivel de confianza que ambas son independientes (Pértega y Pita, 2004). Es necesario calcular las frecuencias esperadas y compararlas con las frecuencias observadas en la realidad. Cuanto mayor sea la diferencia, mayor será la relación entre ambas variables.
Nivel de confianza
El nivel de confianza es la probabilidad priori de que el intervalo de confianza a calcular contenga el verdadero valor del parámetro (Yáñez y Behar, 2009). El nivel de confianza a tomar en cuenta en la exploración será del 95%, por lo que el 5% restante conforma parte del nivel de significancia.
Nivel de significancia
El nivel de significancia se establece como probabilidad de que la hipótesis nula sea rechazada aun siendo verdadera. El nivel de significancia a tomar en cuenta a lo largo de la exploración matemática será del 5%, por lo que la probabilidad de obtener un resultado al azar será del 0,05 para que un resultado sea significativo (Cortés y Gonzáles, 2014).
Observación: A lo largo del trabajo utilizare números con cuatro cifras decimales para no perder precisión en los cálculos, los cuales, una vez hallados, serán redondeados en tres cifras significativas
Habiendo aclarado los conceptos iniciaré con mi exploración matemática.
A partir de los resultados de mi encuesta de la siguiente tabla: (siguiente página)
En la Figure 1 se observan los resultados de cada estudiante que participó en la encuesta. Los primeros seis ítems pertenecen a la sección la construcción de identidades sociales a través de representaciones. Seguidamente, los ítems del siete al treceavo pertenecen a la sección de la violencia psicológica en las representaciones estigmatizantes. Finalmente, los ítems del catorce al dieciochoavo pertenecen a la sección de las relaciones sociales y culturas institucionales en el empoderamiento.Para cálculos posteriores tomaré en cuenta la suma de los resultados de los ítems por cada estudiante, siendo sus puntuaciones totales en la encuesta, y la suma de puntuaciones por ítem. Previamente a utilizar los datos, considero que es necesario comprobar la confiabilidad de los resultados obtenidos, ya que, si no fueran confiables no habría sentido en usar los datos para el propósito de la exploración. ¿En qué medida datos obtenidos poseen confiabilidad? Y ¿Hasta qué punto son convenientes de usar para las pruebas estadísticas respectivas? Para responder estas interrogantes usaré el Coeficiente Alfa de Cronbach como indicador de confiabilidad en la encuesta.
Para poder hallar el Coeficiente Alfa de Cronbach se requiere de esta fórmula -
\(\alpha = \frac{K}{K-1} \left[ 1 - \frac{\sum S_i^2}{S_t^2} \right] \)
Donde -
a = Coeficiente Alfa de Cronbach
Κ = Número de ítems
\( S_i{^2}\) = Sumatoria de Varianzas de los ítems
\(S_t{^2}\)= Varianza de la suma de los ítems
Tomando en cuenta la fórmula presentada, el dato que se tiene es Κ=20, por tanto pasaré a calcular la sumatoria de varianza de los ítems, tomando en cuenta la fórmula de varianza muestral2 -
\(S_i^2 = \frac{\sum_{1}^{n} (x_i - \overline{x})^2}{n-1} \)
Donde -
s2 = Varianza muestral
n = Tamaño de la muestra
xi = Resultado i del ítem
\(\bar{x }=\) Media de la muestra
Debido a que se cuenta con 18 ítems, haré el cálculo de la varianza del primer ítem para luego tabular los resultados de los 17 restantes.
Considerando los resultados de la Tabla 1 calcularé la media de los resultados del primer ítem -
\(\bar{x} = \frac{\sum_{1}^{20} x_i}{20} \)
Aplicando la fórmula -
\(\bar{x} = \frac{5 + 4 + 2 + \ldots + 5}{20} \)
\(\bar{x} =\frac{72}{20}\)
El resultado de la media del ítem 1 es -
\(\bar{x}=3,6\)
Teniendo el valor de la media, la varianza se hallaría de esta manera -
\( S_i{^2 }= \frac{\sum_{1}^{n} (x_i - 3.6)^2}{20 - 1} \)
Sustituyendo los resultados del ítem en la tabla 1, el valor de la media -
\(\begin{equation} S_i^2 = \frac{(5 - 3.6)^2 + (4 - 3.6)^2 + (2 - 3.6)^2 + \ldots + (5 - 3.6)^2}{20 - 1} \end{equation}\)
\(\begin{equation} S_i^2 = \frac{26,8}{19} \end{equation}\)
Por lo tanto, la varianza muestral del ítem 1 es -
\(s^2_i=2,8211\)
Ítem | Varianza | Ítem | Varianza |
---|---|---|---|
1 | 2,8211 | 10 | 3,8895 |
2 | 2,3737 | 11 | 4,5211 |
3 | 3,0053 | 12 | 3,7053 |
4 | 3,6368 | 13 | 5,5737 |
5 | 3,9158 | 14 | 4,1053 |
6 | 3,1579 | 15 | 2,1895 |
7 | 2,7105 | 16 | 2,4158 |
8 | 7,1368 | 17 | 2,6263 |
9 | 2,9474 | 18 | 2,5000 |
Considerando los resultados obtenidos de la Figure 2 en la cual se muestra la varianza de cada uno de los ítems de la Figure 1, la sumatoria de las varianzas de los 18 ítems es -
\(Σ^{20}_1s{^2}_i=63,2316\)
Habiendo obtenido la sumatoria de las varianzas de los ítems, el último dato a obtener para calcular el Coeficiente Alfa de Cronbach, el último dato por hallar es la varianza de la de la suma de los ítems. Para ello se realizará similar al anterior, tomando en cuenta la columna suma (Sf) de la Figure 1. Primeramente, hallaré la media la suma de los ítems -
\(\bar{s}=Σ^{18}_1s_f\)
\(\bar{s}=\frac{87+54+25+...+61}{20}\)
\(\bar{s}=\frac{1110}{20}\)
Calculando, la media de la suma de los ítems es -
\(\bar{s}=055,5\)
Tomando en cuenta la media de la suma de los ítems, ahora puedo hallar la varianza de la suma de los ítems -
\(S_t^2 = \frac{\sum_{1}^{20} (S_f - 55,5)^2}{20 - 1} \)
A continuación, sustituiré la media y la suma de los ítems por estudiante para hallar la varianza de la suma de los ítems -
\(\begin{equation} S_t^2 = \frac{(87 - 55,5)^2 + (54 - 55,5)^2 + (25 - 55,5)^2 + \cdots + (61 - 55,5)^2}{20 - 1} \end{equation}\)
\(\begin{equation} S_t^2 = \frac{3745,0000}{19} \end{equation}\)
Por lo tanto, teniendo los datos necesarios se puede remplazar en la fórmula del Coeficiente Alfa de Cronbach -
\( \alpha = \frac{K}{K-1} \left[ 1 - \frac{\sum S_i^2}{S_t^2} \right] = \frac{18}{18-1} \left[ 1 - \frac{63,2316}{19,1053} \right] \)
Calculando, el valor del Coeficiente Alfa de Cronbach con un nivel de confianza de 95% y significancia 5% (p < 0,05) es (ver Apéndice 2)
\(α\,=\,0,7093 \)
Teniendo el valor del Coeficiente Alfa de Cronbach ahora puedo interpretar su valor acuerdo al nivel de confiabilidad de la siguiente tabla -
Nivel de confiabilidad | Valor alfa de Cronbach |
---|---|
Excelente | 0,9 |
Muy Buena | 0,7 |
Muy Buena | 0,5 |
Regular | 0,3 |
Deficiente | 0 |
Tomando en cuenta la tabla 3 se muestra que el nivel de confiabilidad de la encuesta aplicada es Bueno (0,5 <a ≤0,7). Este resultado es positivo, ya que se ha demostrado que, a partir de los cálculos desarrollados previamente, que los datos obtenidos si son confiables al no tener fallos significativos en su medición que impidan su uso de pruebas estadísticas. Ya comprobado la confiabilidad de los datos del cuestionario aplicado al grupo 1, se procederá a realizar el mismo procedimiento a los resultados del formulario del grupo 2 -
En la Figure 4 se puede observar los resultados del cuestionario aplicado en el grupo 2, el cual tiene las mismas preguntas y divisiones que se aplicó en el grupo 1. Para poder medir la confiabilidad de los datos del segundo grupo se hará uso nuevamente de Coeficiente Alfa de Cronbach, de una manera simplificada, se obtuvo (ver Apéndice 2) -
\(\alpha = \frac{K}{K-1} \left[ 1 - \frac{\sum S_i^2}{S_t^2} \right] = \frac{18}{18-1} \left[ 1 - \frac{38,0658}{161,0816} \right]\)
\(\alpha = 0,8086\)
Tomando en consideración los datos de la Figure3, se muestra que la confiabilidad del grupo dos es muy buena (0,7 <a ≤0,9), genial!, este es un muy buen resultado, ahora sé que ambos grupos tienen la confiabilidad necesaria para poder seguir con los siguientes procedimientos.
Ya obtenido el índice que confiabilidad me parece conveniente evaluar la normalidad de la muestra para determinar si es provechoso usar una prueba paramétrica o una no paramétrica. Dado a esto utilizare el test de Shapiro-Wilk, utilizando la suma de los ítems de la Figure 1 y Figure 4, cual fórmula es -
\( W = \frac{\left(\sum_{i=1}^{n} a_i x_i\right)^2}{\sum_{i=1}^{n} \left(x_i - \bar{x}\right)^2} \)
Donde -
xi = Suma de ítems
ai = Constante de Shapiro-Wilk
n = Tamaño de la muestra
Para poder hallar el valor W, se deben de tomar en cuenta la siguientes hipótesis -
Hipótesis Nula (H0) - La muestra de 40 alumnos proviene de una distribución normal Hipótesis Alterna (H1) - La muestra de 40 alumnos no proviene de una distribución normal
Habiendo establecido ambas hipótesis, al visualizar la tabla de niveles de significación de Shapiro-Wilk (ver Apéndice 3), el valor crítico (VC) que tomare en cuenta es -
Mencionado esto, primero hallaré i=1naixi2, dado a esto ordenaré los valores de la encuesta de mayor a menor y colocaré los valores de las constantes de Shapiro-Wilk de acuerdo al tamaño de la muestra (ver Apéndice 4), en la Tabla 5.
VC = 0,987
El valor crítico es un punto de distribución de la muestra que define los valores que se utilizan para rechazar la hipótesis nula (Leslie, 1986).
Por lo tanto -
Si W> Valor Crítico (VC), se rechaza la H0
Si W> Valor Crítico (VC), se acepta la H0
Mencionado esto, primero hallaré \(\left( \sum_{i=1}^{n} a_i x_i \right)^2 \) dado a esto ordenaré los valores de la encuesta de mayor a menor y colocaré los valores de las constantes de Shapiro-Wilk de acuerdo al tamaño de la muestra (ver Apéndice 4), en la Figure 5.
En la Figure 5 he calculado las diferencias del mayor valor (xi mayor) con el menor valor de la suma de los ítems (xi menor). Seguidamente multipliqué estas diferencias con el valor de la constante de Shapiro-Wilk por ítem. Finalmente, calculé la sumatoria del producto de la constante de Shapiro-Wilk para cada par de ítems con las diferencias del mayor con el menor valor.
Para poder obtener resultado final del numerador, lo elevaré al cuadrado -
\(\left( \sum_{i=1}^{n} a_i x_i \right)^2 = 7353,0282 \)
Seguidamente para poder hallar el denominador, \(\sum_{i=1}^{n} \left( x_i - \bar{x} \right)^2 \) , tendré que calcular la media de la muestra la cual es -
\(\overline{x} = \frac{\sum_{1}^{40} x_i}{40} = 48,7 \)
Ahora, remplazando en la formula el valor de la media de la suma de los ítems y las sumas de los ítems de cada estudiante que se encuentra en la Figure 1 y Figure 4 -
\( \sum_{i=1}^{n} \left( x_i - \bar{x} \right)^2 = (87 - 48,7)^2 + (78 - 48,7)^2 + (74 - 48,7)^2 + \ldots + (25 - 48,7)^2 \)
Calculando, se obtiene que el denominador es -
\( \sum_{i=1}^{n} \left( x_i - \bar{x} \right)^2 = 7892,8000 \)
Tomando en cuenta el numerador y denominador calculados, sus valores se sustituyen en la formula siendo -
\(W = \frac{7353.0282}{7892,8000}\)
Calculando, el valor de la prueba de Shapiro-Wilk es (ver Apéndice 5) -
W = 0,932
Se entiende que W<VC=0,987, se acepta la H0. De esta manera, he podido demostrar que la muestra de 40 estudiantes del colegio de Perú y México cuentan con una distribución normal.
Para poder demostrar la distribución normal de la muestra en una gráfica estadística, lo cual facilitaría la visibilidad de la normalidad en la distribución, realizaré la Campana de Gauss, utilizando los resultados Sf de la Figure 1 y Figure 4 -
Para realizar el Gráfico 1, se realizó los segmentos, la distribución normal, el promedio y la desviación estándar (ver Apéndice 6). De esta manera, en geogebra remplacé los datos y obtuve el gráfico respectivo. Se aprecia que la distribución es normal debido a la forma de campana que tiene la muestra.
Para poder obtener la visualización más a detalle realicé la Campana de Gauss en Excel (ver Apéndice 6) en la cual se aprecia la localización de los puntos de una manera más precisa en la gráfica -
Para realizar el Gráfico 1, se realizó los segmentos, la distribución normal, el promedio y la desviación estándar (ver Apéndice 6). De esta manera, en geogebra remplacé los datos y obtuve el gráfico respectivo. Se aprecia que la distribución es normal debido a la forma de campana que tiene la muestra.
Para poder obtener la visualización más a detalle realicé la Campana de Gauss en Excel (ver Apéndice 6) en la cual se aprecia la localización de los puntos de una manera más precisa en la gráfica -
En el Gráfico 2 se puede apreciar que la curva inicia un poco más elevada a diferencia de la mostrada en el Gráfico 1, sin embargo, sigue teniendo una distribución normal debido a su forma de campana, además este cambio se debe más que todo al programa de geogebra, el cual, tiene una campana de Gauss prediseñada en el programa.
Habiendo comprobado la distribución normal de la muestra a través de la prueba de Shapiro-Wilk y la Campana de Gauss, cabe mencionar que la prueba de hipótesis conveniente a realizar sería una paramétrica debido a la distribución. Antes de aplicar la prueba de hipótesis considero que sería conveniente usar la prueba paramétrica de la Correlación de Pearson para poder determinar que tanto se relaciona la influencia del ambiente con la autoestima de los estudiantes.
Para poner a prueba la correlación pondré a prueba las siguientes hipótesis -
Hipótesis Nula (H0) - No existe correlación lineal positiva entre el ambiente y la autoestima.
Hipótesis Alterna (H1) - Existe una correlación lineal positiva entre el ambiente y la autoestima.
Se sabe que la fórmula del Coeficiente de Correlación de Pearson es -
\(r = \frac{n(\Sigma x y) - (\Sigma x)(\Sigma y)}{\sqrt{\left[n(\Sigma x^2) - (\Sigma x)^2\right] \left[n(\Sigma y^2) - (\Sigma y)^2\right]}} \)
Donde -
r = Coeficiente de Correlación de Pearson
n = Tamaño de la muestra
y = Resultado de los ítems autoestima
x = Resultado de los ítems ambiente
Para realizar la Figure 6 usé la muestra conjunta de ambos grupos, para el eje x sumé los resultados por estudiante de los primeros seis ítems que pertenecen a la sección la construcción de identidades sociales a través de representaciones con los ítems del catorce al dieciochoavo que pertenecen a la sección de las relaciones sociales y culturas institucionales en el empoderamiento. Por otro lado, para el eje y utilicé la suma por estudiante de los ítems del siete al treceavo pertenecen a la sección de la violencia psicológica en las representaciones estigmatizantes.
Ahora, teniendo el tamaño de la muestra como n = 40, remplazaré las sumatorias de la Tabla 6 en la fórmula del Coeficiente de Correlación de Pearson -
\( r = \frac{40 \cdot 24863 - 1318 \cdot 709}{\sqrt{[40 \cdot 46150 - (1318)^2] \cdot [40 \cdot 14579 - (709)^2]}} \)
Calculando el valor del nominador y el denominador se obtiene que -
\(r=\frac{60058}{93606,7925}\)
Resolviendo, el valor de r es (ver Apéndice 7) -
r = 0,6416
Habiendo obtenido el valor de la r, interpretaré su valor según los niveles de significación de correlación, para poder determinar si hay una correlación negativa o positiva entre el ambiente y la autoestima. Debido a ello, tomaré en cuenta la siguiente tabla -
Correlación | Valor de la r |
---|---|
0 | Muy Baja |
0,2 | Baja |
0,4 | Moderada |
0,6 | Alta |
0,8 | Muy Alta |
A partir de la información de la Figure 7 se demuestra que existe una correlación alta, entre el ambiente y la autoestima percibida en los estudiantes. Por lo tanto, la hipótesis nula se rechaza. Esto quiere decir que mientras los aspectos del ambiente sean mayores, es decir, un mayor estatus económico, una mayor presión social, una mayor exigencia y expectativas; mayor será la influencia del mismo en la autoestima.
¡Asombroso!, ahora conociendo que la muestra cuenta con confiabilidad, correlación y tiene distribución normal, me cuestiono si ¿es posible determinar que la autoestima de los estudiantes de México se ve más influenciada por el ambiente considerando las exigencias culturales de su sector? Para confirmarlo resulta necesario utilizar una prueba de hipótesis. Debido a la naturaleza de la muestra utilizaré la prueba T de Welch-Satterthwaite para dos muestras independientes con varianzas heterogéneas, cual formula es -
\(T = \frac{\overline{x_1} - \overline{x_2}}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}} \)
Donde -
\(\bar{x}_1\) - Media de la muestra del grupo 1
\(\bar{x}_2\) - Media de la muestra del grupo 2
S1 - Sumatoria de varianzas del grupo 1
S2 - Sumatoria de varianzas del grupo 2
n1 - Tamaño de la muestra del grupo 1
n2 - Tamaño de la muestra del grupo 2
Las hipótesis para poner a prueba mediante la T de Welch-Satterthwaite son las siguientes -
Hipótesis nula (H0) - Habrá una diferencia significativa entre la influencia del ambiente
en la autoestima de los estudiantes de Perú, que parece que la influencia tiene un menor efecto en la autoestima, que en México, que parece que la influencia tiene un mayor efecto en la autoestima. Hipótesis alterna (H1) - No habrá diferencia significativa entre la influencia del ambiente
en la autoestima de los estudiantes de Perú, que parece que la influencia tiene un menor efecto en la autoestima, que en México, que parece que la influencia tiene un mayor efecto en la autoestima.
Habiendo establecido ambas hipótesis, para hallar el valor de T, tomaré en cuenta las medias y varianzas calculadas en el Coeficiente Alfa de Cronbach de ambos grupos.
Grupos | Muestra | Media | Varianza |
---|---|---|---|
Perú | 20 | 53,6010 | 65,0737 |
México | 20 | 53,6010 | 38,0658 |
En la Figure 8 se puede visualizar la media y varianza de ambos grupos, tomando en cuenta los datos de la tabla, remplazando se obtiene -
\( T = \frac{\overline{x}_1 - \overline{x}_2}{\sqrt{\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}}} = \frac{53.6010 - 44.2136}{\sqrt{\frac{65.0737^2}{20} + \frac{38.0658^2}{20}}} \)
Calculando -
\(\frac{9.3874}{\sqrt{\frac{65,0737^2}{20} + \frac{38,0658^2}{20}}} \)
\(\frac{9,3874}{\sqrt{\frac{4234,5844}{20} + \frac{1449,0043}{20}}} \)
\(\frac{9,3874}{\sqrt{211,7292+72+72,4502}}\)
\(\frac{9,3874}{\sqrt{284,1794}}\)
Por lo tanto -
T = 0,5569
Ahora, ya conociendo el valor T, voy a calcular el grado de libertad (DF) de la prueba T de Welch-Satterthwaite, la cual tiene la siguiente fórmula -
\(DF = \left[ \frac{\left( \frac{s_1^2}{n_1} + \frac{s_2^2}{n_2} \right)^2}{\left( \frac{s_1^2}{n_1} \right)^2/(n_1-1) + \left( \frac{s_2^2}{n_2} \right)^2/(n_2-1)} \right] \)
Remplazando los datos hallados anteriormente en la fórmula -
\(DF=\frac{(211,7292+72,4502)^2}{(\frac{211,7292}{19})+(\frac{72,4502}{19})}\)
Calculando -
\(=\frac{(80757,9514)}{(\frac{211,7292}{19})+(\frac{72,45022}{19})}\)
\(\frac{80757,9514}{11,1436+3,8132}\)
\(\frac{80757,9514}{14,9568}\)
Por lo tanto -
DF = 5399,4093
Conociendo el valor de DF, se debe de aproximarlo con el valor crítico más cercano, el cual seria 1000 en la tabla de T (ver Apéndice 8), considerando un nivel de confianza de 95% y significancia 5% (p < 0,05) y que es un estudio de dos colas, el valor crítico es -
VC = 1,962
Como se mencionó anteriormente, el valor crítico define los valores que se utilizan para rechazar la hipótesis nula, entonces -
Si T > Valor Crítico (VC), se rechaza la H0
Si T > Valor Crítico (VC), se acepta la H0
Se entiende que T<VC=1,962, por tanto, se acepta la H0. De esta manera, he
podido demostrar que efectivamente hay una diferencia significativa entre la influencia del ambiente en la autoestima entre los estudiantes de Perú y México. Lo cual significa que los estudiantes mexicanos presentan una mayor influencia del ambiente en cuanto su autoestima debido a las exigencias culturales de su sector.
Este resultado me reconforto bastante, ya que, la hipótesis principal de mi estudio ha sido demostrada y comprobada. Sin embargo, me parece pertinente evaluar la hipótesis desde una perspectiva cualitativa para poder tener un panorama más amplio de evaluación, dado a esto adaptaré los datos de la Figure 1 y Figure 4 a una tabla cualitativa -
En la Figure 9 se muestra la categorización de los resultados mostrados en la Figure1, en este se puede observar la categorización de “BAJA, MEDIA y ALTA”, lo cual hace referencia al nivel de autoestima que tienen los estudiantes de acuerdo a la encuesta. El mismo procedimiento se realizó con el grupo 2 -
En la Figure 10 se puede observar la categorización de los resultados del grupo de los estudiantes de México. Ambas tablas siguen la siguiente categorización -
x≤30 = ALTA
x≤60 = MEDIA
x≤90 = BAJA
Dada esta agrupación de datos por categorías procederé a realizar la prueba de Chi cuadrado, la cual tiene la siguiente fórmula -
\(x^2=Σ\frac{(0-E)^2}{E}\)
Donde -
x2 = Chi cuadrado
O = Eventos observados
E = Eventos esperados
Para poder hallar el valor de Chi cuadrado, realicé la siguiente tabla -
En la Figure11 se presenta la agrupación de datos de la Figure 10 y Tabla 9, conociendo estos datos utilizaré las siguientes hipótesis -
Hipótesis nula (H0) -No habrá diferencia significativa entre la influencia del ambiente en
la autoestima de los estudiantes de Perú, que parece que la influencia tiene un menor efecto en la autoestima, que en México, que parece que la influencia tiene un mayor efecto en la autoestima. Hipótesis alterna (H1) - Habrá una diferencia significativa entre la influencia del ambiente en la autoestima de los estudiantes de Perú, que parece que la influencia tiene un menor efecto en la autoestima, que en México, que parece que la influencia tiene un mayor efecto en la autoestima.
Ahora empezaré a realizar los cálculos para hallar Chi cuadrado -
\(E: 5 = \frac{(7)(20)}{40}=3,5\)
\(2=\frac{(7)(20)}{40}=3,5\)
\(14=\frac{(29)(20)}{40}=14,5\)
\(15=\frac{(29)(20)}{40}=14,5\)
\(1=\frac{(4)(20)}{40}=2\)
\(3=\frac{(4)}{(20)}=2\)
Sabiendo que el grado de libertad es 2 con un margen de error de 0,05 se remplaza en la fórmula de Chi cuadrado -
\(x^2=Σ\frac{(5-305)^2}{3,5}+\frac{(2-3,5)^2}{3,5}+\frac{(14-14,5)^2}{14,5}+......+\frac{(3-2)^2}{2}\)
Por lo tanto -
x2 = 2,3202
Conociendo el valor de Chi cuadrado calculado, ahora se tiene que comparar con el valor crítico (VC) de acuerdo al grado de libertad (ver Apéndice 9) -
VC = 5,9915
Como se mencionó anteriormente, el valor crítico define los valores que se utilizan para rechazar la hipótesis nula, entonces -
Si x2< Valor Crítico VC, se rechaza la H0
Si x2< Valor Crítico VC, se acepta la H0
Se entiende que x2<VC=2,3202, por tanto, se rechaza la H0. De esta manera, he
podido volver a confirmar que efectivamente hay una diferencia significativa entre la influencia del ambiente en la autoestima entre los estudiantes de Perú y México, afirmando que los estudiantes de México tienen una mayor influencia del ambiente en su autoestima.
A lo largo de mi exploración matemática he aplicado distintas pruebas y hallado coeficientes estadísticos de manera eficaz pudiendo cumplir con el objetivo de manera exitosa. Siendo así, he demostrado que efectivamente existe una correlación lineal positiva alta entre el ambiente y la autoestima. Así como también he podido determinarque los alumnos del segundo año del diploma de México se ven más influenciados estadísticamente por el ambiente, que los estudiantes del segundo año del diploma de Perú, lo que me alegro bastante al ser mi hipótesis planteada.
A partir del desarrollo de la exploración he obtenido distintos aprendizajes. Por un lado, tuve la posibilidad de enriquecer mis conocimientos sobre el manejo de pruebas y vocabulario estadístico que he escuchado con anterioridad, pero realmente no lo manejaba en su totalidad. Asimismo, he aprendido mucho más sobre cómo manejar el programa de Excel y a su vez la aplicación de fórmulas complejas. Sin embargo, la enseñanza que considero una de las más relevantes es haber podido aprender que a pesar de las dificultades y la complejidad de los problemas, somos totalmente capaces de hallar una solución, ya sea matemática o una situación de nuestra vida diaria.
Durante la exploración tuve distintas dificultades respecto a la aplicación de las pruebas por haber tenido fallos en los cálculos del Coeficiente Alfa de Cronbach del grupo 1, por lo que tuve que volver a realizar el procedimiento hasta llegar al resultado real del coeficiente. Del mismo modo, también fue difícil no equivocarme al momento de efectuar la formula debido a que eran 40 participantes con 18 puntuaciones distintas cada uno y había altas probabilidades de que me equivocará al colocar los datos. Estas dificultades me sirvieron de enseñanza para tomar en cuenta que resulta mucho mejor corroborar los datos constantemente e inmediatamente luego de haberlos calculado para no tener dificultades en los cálculos posteriores.
Por otro lado, en cuanto a las limitaciones, al ser una exploración sobre la aplicación estadística, esta involucra probabilidades respecto al nivel de significancia (5%) y confianza (95%), por lo que es necesario tomar en cuenta que los resultados no son 100% certeros, por tanto, es necesaria mayor indagación y réplicas de la exploración. Asimismo, también hay que tener en cuenta la validez poblacional de la muestra, al ser estudiantes de dos distintos países y clases económicas media-alta, se debería de considerar en otra oportunidad la ampliación de la muestra y la inclusión de estudiantes de otras clases sociales.
En la exploración he utilizado pruebas estadísticas y coeficientes con el propósito de evaluar estadísticamente las puntuaciones de los estudiantes en cuanto su autoestima influenciada por el ambiente. Por lo que considero que la exploración es de suma importancia por brindar mayor cercanía sobre cómo se puede usar las matemáticas, en este caso la estadística, para poder visibilizar en qué medida nos vemos influenciados por nuestro entorno y como esto nos afecta emocionalmente. Asimismo, la aplicación que he demostrado en la exploración matemática también puede darse en otras áreas de conocimiento, tal como, las ciencias sociales, humanas y naturales, además de otras áreas que requieran la estadística para evaluar, analizar e interpretar datos cuantitativos y cualitativos.
Chi cuadrado tabla *0,001 (fisica.edu.uy)
Cortés y Gonzales. (2014). Prueba de significación y contraste de hipótesis. Bioestadística para no estadísticos, 9, 1-45. https://bit.ly/3UTNJhr
Dacto, Vaca y Reinoso. (2017). Alfa de Cronbach para validar un cuestionario de uso de tic en docentes universitarios. mktDescubre, 10(3232), 37-48. https://bit.ly/3fEZPum
Hernández, J. (2018). Sobre el uso adecuado del coeficiente de correlación de Pearson: definición, propiedades y suposiciones. Archivos venezolanos de farmacología y terapéutica, 37(5), 587-601. https://bit.ly/3UYvFmd
Howarth, Caroline. (2002). So you are from Brixton?. The struggle for recognition and esteem in a multicultural community, Ethnicities, 2(2), 237-260. https://bit.ly/3SwzAF6
López, J. (2017). Varianza. https://bit.ly/3e2uO3b
Modelos lineales *Tablas.pdf (ugr.es)
Mohd y Bee. (2011). Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Liliefors and Anderson-Darling Tests. Journal of statistical modeling and analytics, 2(1), 21-33. https://bit.ly/3fF46xT
Orman, E. (2022). La media vs. La mediana. https://zdsk.co/3M6EiqW
Ortiz y Moreno. (2011). ¿Se necesita la prueba t de Student para muestras independientes asumiendo varianzas iguales? Comunicaciones en estadística, 4(2), 139-157. *Dialnet-SeNecesitaLaPruebaTDeStudentParaDosMuestrasIndepen-7392667.pdf
Pérez, J. (2014). Como calcular el Coeficiente Alfa de Cronbach. https://bit.ly/3rp0brP
Pita, F. (2004). Asociación de variables cualitativas: test de Chi-cuadrado. Metodología de la investigación. https://bit.ly/3Rta3LD
T-table t-table.xls (sjsu.edu)
Yañez y Behar. (2009). Interpretaciones erradas del nivel de confianza en los intervalos de confianza y algunas explicaciones plausibles. Investigación en publicación matemática. https://bit.ly/3M6UWqb
APÉNDICE 1 - CUESTIONARIO APLICADO (AUTOESTIMA Y AMBIENTE)
APÉNDICE 2 - ALFA DE CRONBACH GRUPO 1 Y GRUPO 2
APÉNDICE 3 - NIVELES DE SIGNIFICACIÓN SHAPIRO-WILK
APÉNDICE 4 - NIVELES PARA EL CONTRASTE DE SHAPIRO-WILK
APÉNDICE 5 - RESULTADO PRUEBA SHAPIRO-WILK
APÉNDICE 6 - CÁLCULOS DE LA DISTRIBUCIÓN NORMAL, PROMEDIO Y DESVIACIÓN ESTÁNDAR DE LA CAMPANA DE GAUSS
APÉNDICE 7 - CÁLCULOS DE LA CORRELACIÓN DE PEARSON
APÉNDICE 8 - TABLA T (WELCH-SATTERTHWAITE)
APÉNDICE 9 - TABLA DE DISTRIBUCIÓN CHI CUADRADO
APÉNDICE 1 - CUESTIONARIO APLICADO (AUTOESTIMA Y AMBIENTE)