Analisi di regressione 13 Per trovare l'errore standard della stima, prendiamo la somma di tutti al quadrato termini residuali e dividere per (n - 2), e poi prendere la radice quadrata del risultato. In questo caso, la somma dei quadrati dei residui è 0.090.160.642.250.04 3.18. Con cinque osservazioni, n - 2 3, e vedere (3.183) 12 1.03. Il calcolo per l'errore standard è relativamente simile a quella di deviazione standard per un campione (n - 2 usata al posto di n - 1). Dà qualche indicazione sulla qualità predittiva di un modello di regressione, con i numeri vedere più bassi che indicano che le previsioni più accurate sono possibili. Tuttavia, lo standard-error misura doesnt indica la misura in cui la variabile indipendente spiega variazioni nel modello dipendente. Coefficiente di Determinazione Come l'errore standard, questa statistica dà un'indicazione di quanto bene un modello di regressione lineare serve come stimatore di valori per la variabile dipendente. Funziona misurando la frazione di variazione totale nella variabile dipendente che può essere spiegato dalla variazione della variabile indipendente. In questo contesto, la variazione totale è costituito di due frazioni: Variazione totale spiegato variazione inspiegabile variazione totale variazione variazione totale Il coefficiente di determinazione. o variazione spiegata come percentuale di variazione totale, è il primo di questi due termini. A volte è espresso come 1 - (variazione inspiegabile variazione totale). Per una semplice regressione lineare con una variabile indipendente, il metodo semplice per calcolare il coefficiente di determinazione è squadratura il coefficiente di correlazione tra le variabili dipendenti ed indipendenti. Poiché il coefficiente di correlazione è dato da r, il coefficiente di determinazione è comunemente noto come R 2 o R-squared. Ad esempio, se il coefficiente di correlazione è 0,76, il R-squared è (0.76) 2 0,578. termini R-squared sono di solito espresse come percentuali così 0,578 sarebbero 57,8. Un secondo metodo di calcolo di tale numero sarebbe di trovare la variazione totale nella variabile dipendente Y come la somma dei quadrati delle deviazioni dalla media del campione. Avanti, calcolare l'errore standard della stima a seguito del processo descritto nella sezione precedente. Il coefficiente di determinazione viene quindi calcolato (variazione totale Y - variazione inspiegabile Y) variazione totale in Y. Questo secondo metodo è necessario che più regressioni, dove c'è più di una variabile indipendente, ma per il nostro contesto sarà fornito noi r (coefficiente di correlazione) per calcolare un R-squared. Cosa R 2 ci dice è i cambiamenti nella variabile Y dipendente che sono spiegati da cambiamenti nella R X. variabile indipendente 2 di 57.8 ci dice che il 57,8 dei cambiamenti nel risultato Y da X significa anche che 1-57,8 o 42,2 di le variazioni di Y sono inspiegabili da X e sono il risultato di altri fattori. Quindi maggiore è la, migliore è la natura R-squared predittiva del modello lineare regressione. Coefficienti di regressione sia per coefficiente di regressione (intercettare una, o pendenza b), un intervallo di confidenza può essere determinato con le seguenti informazioni: 13 Un valore di parametro stimato da un campione di 13 Errore standard della stima (vedi) di livello 13 Significato per la t - distribuzione di 13 gradi di libertà (che è la dimensione del campione - 2) 13 per un coefficiente di pendenza, la formula per intervallo di fiducia è dato da VEDI BTC, dove tc è il valore t critica al nostro livello significativo prescelto. Per illustrare, prendere una regressione lineare con fondi comuni restituisce come variabile dipendente e l'indice SampP 500 come variabile indipendente. Per cinque anni di rendimenti trimestrali, il coefficiente di pendenza b si trova ad essere 1,18, con un errore standard della stima di 0.147. Studenti t-distribuzione per 18 gradi di libertà (20 quarti - 2) ad un livello di significatività 0.05 è 2.101. Questi dati ci dà un intervallo di confidenza del 1,18 (0,147) (2.101), o un intervallo di 0,87-1,49. La nostra interpretazione è che c'è solo un 5 possibilità che la pendenza della popolazione è o meno di 0.87 o superiore a 1,49 - siamo 95 sicuri che questo fondo è di almeno 87 volatile come il SampP 500, ma non più di 149 come volatile, basato sul nostro campione di cinque anni. coefficienti di test di ipotesi e di regressione coefficienti di regressione sono spesso testati utilizzando la procedura di verifica delle ipotesi. A seconda di ciò l'analista intende dimostrare, possiamo testare un coefficiente di pendenza per determinare se spiega occasioni nella variabile dipendente, e la misura in cui spiega modifiche. Beta (coefficienti di pendenza) possono essere determinate per essere sopra o sotto 1 (più volatili o meno volatile rispetto al mercato). Alfa (il coefficiente di intercettazione) può essere testato su una regressione tra un fondo comune di investimento e l'indice di mercato rilevante per determinare se vi è evidenza di un alfa sufficientemente positivo (valore aggiunto suggerendo dal gestore del fondo). La meccanica di test di ipotesi sono simili agli esempi che abbiamo usato in precedenza. Una ipotesi nulla viene scelta in base maggiore di o caso meno-che-non-uguali a,, con l'alternativa soddisfare tutti i valori che non rientrano nel caso nullo. Supponiamo che nel nostro esempio precedente in cui abbiamo regredito a fondi comuni di investimento torna sui 500 per 20/4 SampP la nostra ipotesi è che questo fondo comune di investimento è più volatile rispetto al mercato. Un fondo pari della volatilità al mercato avrà pendenza b di 1,0, quindi per questo test ipotesi si specifica l'ipotesi nulla (H 0) come il caso in cui pendenza è inferiore o superiore a 1,0 (cioè H 0: b lt 1.0 ). L'ipotesi alternativa H a ha b gt 1.0. Sappiamo che questo è un caso di maggiore (cioè una coda) - se si assume un livello di significatività 0.05, t è pari a 1.734 in gradi di libertà n - 2 18. Esempio: Interpretare una verifica dell'ipotesi Dal nostro campione, aveva stimato B di 1.18 e l'errore standard di 0.147. La nostra statistica del test viene calcolata con questa formula: t stimato Coefficiente - ipotizzato coeff. errore standard (1,18-1,0) 0,147 0.180.147, o t 1.224. Per questo esempio, la nostra statistica test calcolata è al di sotto del livello di rifiuto di 1.734, quindi non sono in grado di rifiutare l'ipotesi nulla che il fondo è più volatile rispetto al mercato. Interpretazione: l'ipotesi che B GT 1 per questo fondo, probabilmente ha bisogno di più osservazioni (gradi di libertà) per essere provato con significatività statistica. Inoltre, con 1,18 di poco superiore a 1.0, è del tutto possibile che questo fondo non è in realtà come volatile come il mercato, e siamo stati corretti di non rifiutare l'ipotesi nulla. Esempio: Interpretare un coefficiente di regressione L'esame CFA è probabile che dare le statistiche di riepilogo di una regressione lineare e chiedere per l'interpretazione. Per illustrare, assumere le seguenti statistiche per una regressione tra un fondo di crescita small cap e il Russell 2000 Index: 13 Coefficiente di correlazione 13 Le due sigle per capire RSS e SSE: 13 RSS. o la somma di regressione dei quadrati, è la quantità di variazione totale in Y variabile dipendente che si spiega nell'equazione di regressione. Il feed viene calcolato calcolando ciascuna deviazione tra un valore Y predetto e il valore medio di Y, squadratura la deviazione e sommando tutti i termini. Se una variabile indipendente spiega nessuna delle variazioni di una variabile dipendente, allora i valori predetti di Y sono uguali al valore medio, e feed 0. 13 SSE. o la somma di errore quadratico dei residui, è calcolato trovando la deviazione tra un Y prevista e un vero Y, quadratura del risultato e sommando tutti i termini. 13 TSS, totale o variazione, è la somma di RSS e SSE. In altre parole, questo processo ANOVA rompe varianza in due parti: una che si spiega con il modello e uno che non lo è. In sostanza, per un'equazione di regressione di avere alta qualità predittiva, abbiamo bisogno di vedere un alto e un basso RSS SSE, che renderà il rapporto (RSS1) SSE (n - 2) alto e (sulla base di un confronto con un F - critica valore) statisticamente significativo. Il valore critico viene prelevato dalla F-distribuzione e si riferiscono al gradi di libertà. Ad esempio, con 20 osservazioni, gradi di libertà sia n - 2, o 18, risultando in un valore critico (dalla tabella) di 2,19. Se RSS erano 2,5 e SSE sono stati 1,8, quindi la statistica test calcolata sarebbe F (2,5 (1.818) 25, che è al di sopra del valore critico, che indica che l'equazione di regressione ha qualità predittiva (b è diverso da 0) stimare Statistiche economiche con i modelli di regressione modelli di regressione sono spesso utilizzati per stimare le statistiche economiche come l'inflazione e la crescita del PIL assumere i seguenti regressione è fatta tra l'inflazione annuale stimato (X, o variabile indipendente) e il numero effettivo (Y o variabile dipendente). l'utilizzo di questo il modello, il numero di inflazione previsto sarebbe stato calcolato sulla base del modello per i seguenti scenari di inflazione: 13 l'inflazione stima 13 l'inflazione in base al modello 13 le previsioni basate su questo modello sembrano funzionare meglio per le stime tipiche di inflazione, e suggeriscono che le stime estremi tendono a sovrastimare l'inflazione - ad esempio una inflazione effettiva di appena 4.46, quando la stima era 4.7 il modello sembra suggerire che le stime sono altamente predittivi.. Anche se per valutare meglio questo modello, avremmo bisogno di vedere l'errore standard e il numero di osservazioni su cui si basa. Se conosciamo il vero valore dei parametri di regressione (pendenza e intercetta), la varianza di qualsiasi valore y previsto sarebbe pari al quadrato della errore standard. In pratica, dobbiamo stimare i parametri di regressione così il nostro valore previsto per Y è una stima basata su un modello di stima. Come fiducioso possiamo essere in un tale processo Al fine di determinare un intervallo di predizione, impiegare le seguenti operazioni: 1. prevedere il valore della variabile dipendente Y basata sull'osservazione indipendente X. 2. Calcolare la varianza dell'errore di predizione, utilizzando il seguente equazione: 13 Dove: s 2 è l'errore standard quadrato della stima, n è il numero di osservazioni, X è il valore della variabile indipendente utilizzata per effettuare la previsione, X è il valore medio stimato della variabile indipendente e sx 2 è la varianza di X. 3. Scegliere un livello di significatività per l'intervallo di confidenza. 4. Costruire un intervallo (1 -) la fiducia per cento, utilizzando la struttura Y t c s f. Ecco un altro caso in cui il materiale diventa molto più tecnico del necessario e si può ottenere impantanati nella preparazione, quando in realtà la formula per la varianza di un errore di previsione è neanche suscettibili di essere coperti. Dare priorità - non sprecare preziose ore di studio memorizzarlo. Se il concetto è testato a tutti, youll probabilmente essere data la risposta a Parte 2. Basta sapere come utilizzare la struttura nella parte 4 per rispondere a una domanda. Ad esempio, se l'osservazione X previsto è 2 per la regressione Y 1.5 2.5X, avremmo un Y previsto di 1,5 2,5 (2), o 6.5. Il nostro intervallo di confidenza è di 6,5 t c s f. La t-stat è basato su un intervallo di confidenza prescelto e gradi di libertà, mentre sf è la radice quadrata della suddetta equazione (per la varianza dell'errore di predizione. Se questi numeri sono tc 2.10 95 fiducia e sf 0,443, l'intervallo è 6.5 (2.1) (0,443), o 5,57-7,43 limitazioni di Analisi di regressione si concentrano su tre limitazioni principali:. 1. Parametro instabilità - Questa è la tendenza per le relazioni tra le variabili a cambiare nel corso del tempo a causa di cambiamenti nell'economia o nei mercati ., tra le altre incertezze se un fondo comune di investimento ha prodotto una storia di ritorno in un mercato in cui la tecnologia è un settore di leadership, il modello non può funzionare quando i mercati esteri e bassa capitalizzazione sono leader 2. pubblica diffusione del rapporto -. in un mercato efficiente , questo può limitare l'efficacia di quella relazione in periodi futuri. ad esempio, la scoperta che le scorte a basso prezzo-to-book value superano alto valore prezzo-book significa che queste azioni possono essere un'offerta più alta, e gli approcci di investimento basate sul valore non manterrà la stessa relazione come in passato. 3. La violazione delle relazioni di regressione - In precedenza abbiamo riassunto i sei presupposti classici di una regressione lineare. Nel mondo reale queste assunzioni sono spesso irrealistiche - ad esempio supponendo che la variabile X indipendente non è random. Interpreting risultati statistici risultati dove i dati sono distribuiti normalmente e varianza è conosciuta o sconosciuta 13 Ogni volta che la varianza di una popolazione (2) è noto, la z-test è l'alternativa preferita per testare una ipotesi di popolazione media (). Per calcolare la statistica test, errore standard è pari a mq popolazione deviazione standard. Radice della dimensione del campione. Ad esempio, con una varianza popolazione di 64 e un campione di 25, errore standard è uguale a (64) 12 (25) 12. o 1.6. 13 Esempio: Test di Statistica 13 Supponiamo che in questo stesso caso abbiamo costruito un test di ipotesi che il ritorno medio annuo è pari a 12, che è, abbiamo un test a due code, in cui l'ipotesi nulla è che la media della popolazione 12, e l'alternativa è che non è uguale a 12. Con un livello critico 0,05 (0,025 per ciascuna coda), la nostra regola è quella di rifiutare l'ipotesi nulla quando la statistica test è o al di sotto o al di sopra -1.96 1.96 (a p .025, z 1.96 ). Supponiamo campione media 10.6. 13 Risposta: Test di statistica (10,6-12) 1.6 -1.41.6 -0,875. Questo valore non scenda al di sotto del punto di rifiuto, quindi non possiamo rifiutare l'ipotesi nulla con certezza statistica. 13 Quando stiamo facendo test di ipotesi su una popolazione significano, la sua relativamente probabile che la varianza della popolazione sarà sconosciuto. In questi casi, si usa una deviazione standard del campione quando si calcola l'errore standard, e la statistica t per la regola di decisione (cioè come fonte per il nostro livello di rifiuto). Rispetto alla Z o standard normale, una t-statistica è di più (cioè punti di rigetto più elevati per rifiutare l'ipotesi nulla) conservatori. Nei casi con campioni di grandi dimensioni (almeno 30), la statistica z può essere sostituito. 13 Esempio: Prendere un caso in cui la dimensione del campione è di 16. In questo caso, il t-stat è l'unica scelta appropriata. Per la distribuzione t, gradi di libertà sono calcolati come (dimensione del campione - 1), DF 15 in questo esempio. In questo caso, assumiamo stiamo testando una ipotesi che una popolazione media è superiore a 8, quindi questa sarà una una coda di prova (coda destra): ipotesi nulla è lt 8, e l'alternativa è che gt 8. La nostra richiesta significato il livello è di 0,05. Utilizzando la tabella per gli studenti t-distribuzione per df 15 e p 0,05, il valore critico (punto di rifiuto) è 1.753. In altre parole, se la nostra statistica test calcolata è superiore a 1.753, rifiutiamo l'ipotesi nulla. 13 Risposta: Lo spostamento al punto 5 del processo di verifica delle ipotesi, prendiamo un campione in cui la media è 8,3 e la deviazione standard è 6.1. Per questo esempio, errore standard S n 12 6,1 (16) 12 6.14 1.53. La statistica test è (8,3-8,0) 1.53 0.31.53, o 0.196. Confrontando 0.196 al nostro punto rifiuto di 1.753, siamo in grado di rifiutare l'ipotesi nulla. 13 Si noti che in questo caso, il nostro campione media di 8,3 era effettivamente maggiore di 8 Tuttavia, la prova ipotesi è impostato per richiedere significatività statistica, non semplicemente confrontare una media del campione all'ipotesi. In altre parole, le decisioni prese nei test ipotesi sono anche in funzione della dimensione del campione (che a 16 è bassa), la deviazione standard, il livello richiesto di significatività e la distribuzione t. La nostra interpretazione in questo esempio è che il 8.3 da la media del campione, mentre nominalmente superiore a 8, semplicemente non sta significativamente superiore a 8, almeno fino al punto in cui sarebbe in grado di fare definitivamente una conclusione per quanto riguarda la popolazione significa essere superiore a 8 . 13 uguaglianza relativa della popolazione medie di due popolazioni normalmente distribuite, dove campione casuale indipendente assunto varianze sono uguali o disuguali per il caso in cui le varianze della popolazione per due gruppi separati può essere assunto pari, una tecnica per mettere in comune una stima della varianza della popolazione (s 2) dai dati campione è dato dalla seguente formula (presuppone due campioni casuali indipendenti): 13 Dove: n 1. n 2 sono campioni formati, e s 1 2. s 2 2 sono varianze campionarie. 13 gradi di libertà n 1 n 2 - 2 13 Per l'uguaglianza sperimentazione di due medie della popolazione (vale a dire 1 2), la statistica test calcola la differenza di medie campionarie (X 1 - X 2), diviso per l'errore standard: la radice quadrata di (s 2 n 1 s 2 n 2). Esempio: Popolazione Mezzi supponga che la stima pooled della varianza (s 2) era di 40 e indossa una taglia per ogni gruppo era 20. Errore standard (4020 4020) 12 (8020) 2. Risposta: Se medie campionarie erano 8.6 e 8.9, il t (8,6-8,9) 2 -0.32 -0.15. Prove di equalityinequality sono test su due lati. Con df 38 (somma di campioni formati - 2) e se assumiamo 0,05 significatività (p 0.025), il livello di rifiuto è t lt -2,024, o t gt 2.024. Dal momento che la nostra statistica test calcolata era -0.15, non possiamo rifiutare l'ipotesi nulla che queste medie della popolazione siano uguali. 1. Per test di ipotesi di parità di popolazione significa in cui gli scostamenti non possono essere considerate uguali, la statistica test appropriato per l'ipotesi è la t-stat, ma non si può più in comune una stima della deviazione standard, e l'errore standard diventa la piazza radice (s 1 2 n 1) (s 2 2 n 2). L'ipotesi nulla rimane 1 2. e la statistica test è calcolata simile all'esempio precedente (cioè differenza nel campione significa errore standard). gradi di libertà Computing è approssimata da questa formula 13 Look Out 13 Nota: Non passare il tempo a memorizzare questa formula che non sarà necessario per l'esame. Concentrarsi invece sui gradini della verifica delle ipotesi e interpretazione dei risultati. 13 I-confronti a coppie testare l'esempio precedente testato l'uguaglianza o disuguaglianza delle due medie di popolazione, con un assunto fondamentale che le due popolazioni sono indipendenti l'uno dall'altro. In un test-confronti a coppie, le due popolazioni hanno un certo grado di correlazione o co-movimento, e il calcolo della statistica test tiene conto di questa correlazione. Prendere un caso in cui stiamo confrontando due fondi comuni di investimento, che sono entrambi classificati come crescita large cap, in cui si stanno verificando se i ritorni per uno sono significativamente sopra l'altro (statisticamente significativo). Il test confronti paired - è appropriato dato che si suppone un certo grado di correlazione, come i ritorni per ogni sarà dipendente dal mercato. Per calcolare la statistica t, per prima troviamo la media campionaria differenza. indicato con d: d (1n) (. d 1 d 2 d 3 dn), dove n è il numero di osservazioni accoppiati (nel nostro esempio, il numero di quarti per cui abbiamo trimestrali), ed ogni d è la differenza tra ogni osservazione nel campione. Avanti, campione di varianza. o (somma di tutte le deviazioni da d) 2 (n - 1) viene calcolato, con deviazione standard (s d) la radice quadrata positiva della varianza. Errore standard sd (n) 12. Per il nostro esempio reciproca, se i nostri rendimenti medi sono per 10 anni (40 quarti di dati), un campione differenza media di 2,58, e una deviazione standard campione di 5,32, la nostra statistica test è calcolata come (2.58) ((5.32) (40) 12), o 3.067. A 49 gradi di libertà con un livello di significatività 0.05, il punto di rifiuto è 2.01. Così noi rifiutiamo l'ipotesi nulla e affermano che non vi è una differenza statisticamente significativa nei rendimenti tra questi fondi. Test di ipotesi sulla varianza di una distribuzione normale test di popolazione di ipotesi riguardanti il valore di una varianza (2) Avviare formulando le ipotesi nulla e alternativa. 13 Nel test di ipotesi per la varianza su una singola popolazione normalmente distribuita, la statistica test appropriata è conosciuto come un chi-quadrato, indicata con 2. A differenza delle distribuzioni che abbiamo usato in precedenza, il chi-quadrato è asimmetrica in quanto è legato a sinistra da zero. (Questo deve essere vero in quanto la varianza è sempre un numero positivo.) Il chi-quadro è in realtà una famiglia di distribuzioni simili alle t-distribuzioni, con diversi gradi di libertà con una conseguente diversa distribuzione chi-quadrato. 13 Dove: n dimensione del campione, s varianza 2 campione, 0 2 popolazione varianza dall'ipotesi Esempio varianza s 2 viene riferimento come la somma delle deviazioni tra valori osservati e media del campione 2. gradi di libertà, o n - 1 Esempio: test di ipotesi w Chi quadrato statistica per illustrare un test di ipotesi utilizzando la statistica chi-quadrato, prendere un esempio di un fondo che noi crediamo è stato molto volatile rispetto al mercato, e vogliamo dimostrare che il livello di rischio (come misurato dalla deviazione standard trimestrale ) è maggiore rispetto ai mercati media. Per i nostri test, si suppone che il mercato trimestrale, la deviazione standard è 10. Il nostro test esaminerà i rendimenti trimestrali negli ultimi cinque anni, in modo da n 20, e gradi di libertà 19. Il nostro test è un maggiore di test con l'ipotesi nulla di 2 lt (10) 2. o 100, e una ipotesi alternativa di 2 GT 100. Utilizzando un livello di significatività, il nostro punto di rifiuto 0,05, dai tavoli chi-quadro con df 19 e p 0,05 nella coda destra, è 30,144. Così se la nostra statistica test calcolata è maggiore di 30,144, rifiutiamo l'ipotesi nulla a 5 livello di significatività. Risposta: Esaminando i rendimenti trimestrali di questo periodo, troviamo il nostro varianza campionaria (s 2) è 135. Con n 20 e 0 2 100, abbiamo tutti i dati necessari per calcolare la statistica test. 2 ((n - 1) s 2) 0 2 ((20 - 1) 135) 100 2.565.100 o 25.65. Dal 25.65 è inferiore a nostro valore critico di 30,144, non abbiamo prove sufficienti per rifiutare l'ipotesi nulla. Anche se questo fondo può effettivamente essere molto volatile, la sua volatilità è neanche statisticamente più significativo rispetto alla media di mercato del periodo. Test di ipotesi relative al l'uguaglianza delle varianze di due normalmente distribuite popolazioni, in cui entrambi i campioni sono casuali e indipendenti per test di ipotesi riguardanti i valori relativi delle varianze di due popolazioni - siano essi 1 2 (varianza della prima popolazione) e 2 2 (varianza del secondo) sono equalnot equalgreater thanless che - siamo in grado di costruire ipotesi in uno dei tre modi. 13 Quando un test di ipotesi a confronto varianze da due popolazioni e si può supporre che i campioni casuali delle popolazioni sono indipendenti (non correlati), il test appropriato è il F-test, che rappresenta il rapporto tra varianze campionarie. Come per il chi-quadro, l'F-distribuzione è una famiglia di distribuzioni asimmetriche (legato a sinistra da zero). Il F-famiglia di distribuzioni è definita da due valori di gradi di libertà: il numeratore (df 1) e al denominatore (T 2). Ognuno dei gradi di libertà sono presi dalle dimensioni del campione (ciascuna dimensione del campione - 1). Il test F preso dai dati di esempio potrebbe essere o s 1 2 s 2 2. o s 2 2 s 1 2 - con la convenzione di utilizzare qualsiasi rapporto produce il maggior numero. In questo modo, l'F-test deve preoccuparsi solo con valori maggiori di 1, dal momento che uno dei due rapporti sta andando sempre essere un numero sopra 1. Esempio: Test di ipotesi w Rapporto varianze del campione Per illustrare, rimessa caso di due fondi comuni di investimento. Un Fondo ha goduto di maggiori rendimenti di performance rispetto a fondo B (che weve di proprietà, purtroppo). La nostra ipotesi è che il livello di rischio tra questi due è in realtà molto simile, cioè il Fondo A ha risultati aggiustati per il rischio superiori. Ci prova l'ipotesi per gli ultimi cinque anni di dati trimestrali (DF è 19 sia per il numeratore e denominatore). Utilizzando 0.05 importanza, il nostro valore critico della F-tavoli è 2.51. Si supponga dal campione di cinque anni che deviazioni standard trimestrali sono stati 8.5 per Fondo A, e 6.3 per Fondo B. Risposta: Il nostro F-statistica è (8,5) 2 (6,3) 2 72.2539.69 1,82. Dato 1.82 non raggiunge il livello di rifiuto di 2.51, non possiamo rifiutare l'ipotesi nulla, e noi affermare che il rischio tra questi fondi non è significativamente diverso. Concetti dalla sezione di verifica delle ipotesi è improbabile che siano testati da esercizi rigorosi nel macinare numeri, ma piuttosto nell'individuare le caratteristiche uniche di un dato statistico. Ad esempio, una domanda tipico potrebbe chiedere, in test di ipotesi, che statistica test è definito da due gradi di libertà, il numeratore e il denominatore, dando queste scelte: A. t-test, B. z-test, C. chi - square, o D. F-test. Naturalmente, la risposta sarebbe D. Un'altra domanda potrebbe chiedere, che la distribuzione non è simmetrico, e poi danno queste scelte: A. t, B. z, C. chi-quadrato, D. normale. Qui la risposta sarebbe C. Focus sulle caratteristiche che definiscono, in quanto sono la fonte più probabile di domande d'esame. Parametrica e non parametrica Prove Tutti i test di ipotesi descritte finora sono stati progettati, in un modo o nell'altro, per verificare il valore previsto di uno o più parametri - variabili incognite quali media e varianza che caratterizzano una popolazione ei cui valori osservati sono distribuiti in un certo modo assunti. In effetti, queste ipotesi specifiche sono obbligatori e anche molto importante: la maggior parte dei test comunemente applicati sono costruiti con i dati che si assume la popolazione sottostante è distribuita normalmente, che, se non è vero, invalida le conclusioni raggiunte. Il meno normale popolazione (cioè il più asimmetrica i dati), il meno questi test o procedure parametrici dovrebbe essere utilizzata per gli scopi previsti. test di ipotesi non parametrici sono progettati per i casi in cui (a) meno o diverse ipotesi circa i dati della popolazione sono appropriati, o (b) se il test di ipotesi non è interessato a un parametro della popolazione. In molti casi, siamo curiosi di un insieme di dati, ma crediamo che le assunzioni richieste (per esempio, i dati normalmente distribuiti) non si applicano a questo esempio, oppure la dimensione del campione è troppo piccolo per fare comodamente tale ipotesi. Un certo numero di alternative non parametrici sono stati sviluppati per utilizzare in tali casi. La tabella seguente indica alcuni esempi che sono analoghe a test parametrici comuni. 13 La preoccupazione di ipotesi
No comments:
Post a Comment