Silent » posted to Silent and italia
C'è qualcuno molto bravo in statistica in sala?
frugola? ‎- Silent
meandthebay? ‎- Silent
Up ‎- Pea Bukowski
Fatto 100 un campione, il 3% non è sicuro, il 96% non sa/non dice, l'1% che fa le statistiche le fa per il LOL (cioè è un cretino). Sei messa benissimo. ‎- Nervo and the Alien Mindbenders
Silent? ‎- PaoloPost
Io un po' ne so, @dasnake pure... Tu fa' la domanda, poi qualcosa si imbastisce. ‎- ıɔ ǝɯɯǝ ˙ɹp
Oh, eccovi! Ho qualche problema con con linear mixed models / random effects. Sto utilizzando SPSS perché è il software più comune nel mio ambito, ma ripetendo le analisi anche con SAS continuano a verificarsi gli stessi problemi. Nello specifico: ‎- Silent
1) I risultati hanno senso e sono quelli che mi aspetto, MA ho una matrice hessiana negativa e la cosa mi turba ‎- Silent
2) Ho uno strano output nella tabella con medie ed errori standard per i diversi livelli: le medie sono leggermente sballate (ma non troppo) rispetto a quelle reali, e gli errori standard risultano essere identici per tutte le condizioni (che non ha alcun senso). Dunque credo di sbagliare qualcosa, ma non capisco cosa. ‎- Silent
Sto guardando dei tutorial, e mi sembra di aver fatto tutto giusto. Per questo sono disperata. ‎- Silent
Dettagli sul mio modello: ho due fixed effects (un fattore a 4 livelli e un fattore a 2 livelli) e un random effect ‎- Silent
L'effetto random lo includo sia nell'intercetta che nello slope ‎- Silent
Sospetto di dover giocare con la matrice di covarianza, ma vado un po' alla cieca. ‎- Silent
Forse anche emme ne sa ‎- Silent
Non ho una risposta. PERO' GUARDA QUANT'È LUNGO IL PELO SU QUESTA PALLA! ‎- Fabrizio Casu
:( ‎- Silent
[Il mio capo figodiddio che capisce tutto è passato di fronte al mio monitor e gli ho esposto il problema, mi ha risposto "Yeah, that's weird. I don't know anything about this" e se n'è andato. SIGH.] ‎- Silent
(Capo di Silent uno di noi) ‎- Fabrizio Casu
(se ne è andato in bagno a misurarsi i peli, per vedere se li ha più lunghi di Casu, nella media oppure sulla mediana) ‎- Ivan Crema
Eppure dovrà pure esserci un appassionato di modelli misti nel mondo. MAGARI I RUSSI QUI NE SANNO A PACCHI. ‎- Silent
QUINDI PARLI DI PACCHI ‎- virus
/////////QUESTO THREAD PARLA ORA DI PACCHI//////// ‎- grandmaster_flash
modelli misti e pacchi: bisexthreesome.mp4 ‎- Ivan Crema
UHM ‎- emme
(ora diche una cazzata) ma se utilizzi il modello GLM e metti il random effect semplicemente come covariata? ‎- emme
Nein. In realtà ho provato, ma le condizioni non sono distribuite uniformemente tra i gruppi. Sto lavorando sui segnali intracorticali, e una dei fattori che mi interessa è la localizzazione dei contatti (insula anteriore vs. posteriore). Però ho alcuni soggetti con contatti sia anteriori che posteriori, alcuni solo anteriori. ‎- Silent
(Il motivo per cui utilizzo LMM è perché suppongo che contatti appartenenti allo stesso elettrodo non siano indipendenti) ‎- Silent
Quindi i motivi sarebbero due: i missing data e la non-indipendenza dei contatti ‎- Silent
però non riesco a capire come hai costruito il db ‎- emme
Ho due fattori (modalità di stimolazione: 4 livelli; localizzazione: 2 livelli). Ho diversi soggetti, ciascuno dei quali ha uno o più elettrodi insulari, con diversi contatti. Quindi ho una colonna con i contatti, ovviamente ripetuti più volte per le repeated measures. ‎- Silent
(sto spiegando da cani? può essere) ‎- Silent
Quindi i miei fixed effects sono "Modality" e "Location". Il mio random effect è "Subject" (contatti dello stesso soggetto non sono indipendenti) ‎- Silent
Seguo alla lettera gli esempi dei manuali. Gli esempi sono sempre con la classe di bambini. Per me i contatti sono i bambini, gli elettrodi (o meglio i soggetti) sono le classi. ‎- Silent
'spe, mi sento confusa: non stai facendo un'analisi per soggetti, in sostanza ‎- emme
Con chiunque ho parlato, mi sono sentita rispondere "sì, ha senso". Però nessuno riesce a capire perché ho una matrice hessiana negativa e i risultati un po' sballati. ‎- Silent
perché i contatti dello stesso elettrodo/soggetto non sono indipendenti! come i bambini di una stessa scuola non sono indipendenti! ‎- Silent
no no. la mia è un'analisi per contatti insulari. ‎- Silent
Quello che normalmente è il soggetto, per me è il contatto nell'insula. Ogni contatto appartiente a un elettrodo/soggetto. Quindi per me il soggetto è il secondo livello, non il primo. ‎- Silent
Quindi io ho alcuni contatti anteriori, altri posteriori. E ho 4 modalità di stimolazione, ciascuna delle quali evoca delle risposte in questi contatti. Le mie domande sono "c'è un effetto della modalità?" e "c'è un effetto della localizzazione?" Quello che normalmente faresti con un'ANOVA 4 X 2 dunque. Ma io non posso usare l'ANOVA per via dei dati mancanti e della non indipendenza dei contatti. ‎- Silent
(perché ovviamente non possiamo scegliere noi dove impiantare gli elettrodi, e non avremo mai lo stesso numero di contatti anteriori e posteriori) ‎- Silent
Ovviamente. ‎- virus
(emme è giustamente scappata, ahah) ‎- Silent
uhm. non sono analisi che faccio, quindi temo di dirti solo minchiate. io in ogni caso partirei facendo un'analisi ultraconservativa sui soli soggetti senza missing, solo per vedere che effetti presentano ‎- emme
Non so nulla di statistica, ma non potresti prima semplificare il problema, avere dati sensati su quello e poi aggiungere complessita' step by step. Se non non ne esci. ‎- Sciack metallurgico
emme, ho provato anche così. Cioè, con l'ANOVA ho i risultati che voglio. Però mi serve considerare anche i soggetti senza elettrodi posteriori :( ‎- Silent
Sciack, ma il livello semplice ce l'ho, ed è risolto. Quello complesso in teoria pure (ho un manuale con un esempio simile al mio, lo seguo alla lettera). L'enigma è che i conti non tornano. Quindi c'è probabilmente qualche parametro che ignoro (la matrice di covarianza?) che dovrei modificare. ‎- Silent
Comunque se rinasco studio statistica. Gli statistici hanno il mondo nelle loro mani. ‎- Silent
(Che poi, anche i soggetti senza missing, mica hanno lo stesso numero di contatti anteriori e posteriori. Il numero non corrisponde MAI) ‎- Silent
i soggetti senza elettrodi posteriori servono a vedere l'effetto modalità, no? a questo quesito rispondono necessariamente come sottogruppo in analisi separata, non avendo per definizione la possibilità di entrare nell'analisi col fattore localizzazione ‎- emme
ma scusa, non è come avere delle condizioni con diverso numero di trial? ‎- emme
No, servono anche a vedere l'effetto di localizzazione. Perché quei contatti anteriori potrebbero dare risposte molto diverse dai contatti posteriori degli altri soggetti. La mia unità di analisi sono i contatti, non i soggetti. ‎- Silent
Altrimenti servirebbe un soggetto con contatti impiantati in tutti i punti dell'insula, cosa che non è possibile. Quindi mi occorre attingere da contatti diversi di soggetti diversi. ‎- Silent
(niente, probabilmente non riesco a disancorarmi dalla mia modalità standard, mi spiace :( ) ‎- emme
(per dire, a me verrebbe da criticare ferocemente questo approccio, ma magari è lo standard aureo nella letteratura di riferimento) ‎- emme
Infatti con l'ANOVA questa cosa non la puoi fare. (Con i mixed models in teoria sì: casualmente posso avere dei bambini in una stessa classe che ricevono solo una condizione, e bambini di un'altra classe che ne ricevono due. Questo è almeno ciò che dicono i manuali) ‎- Silent
Ma è proprio perché è un approccio difficile che usiamo i mixed models. Nel senso che, hai dei soggetti a disposizione, ognuno ha 4-6 contatti nell'insula, che da soli non ti possono dire granché. Per avere una "mappatura" di quello che succede nell'insula, in qualche modo devi metterli insieme. Ovviamente, tenendo conto del fatto che contatti dello stesso soggetto non sono indipendenti. E di questo però tieni conto col random effect. ‎- Silent
(non so, questa trasposizione mi convince poco, ma da un punto di vista logico, eh, prima che statistico. è il quesito che guida l'analisi e secondo me al tuo (doppio) quesito è difficile rispondere con dati di questo tipo. poi, magari sono gli unici dati che è possibile ricavare dai soggetti, ma allora forse il quesito va parcellizzato ‎- emme
ma il punto (per me, a logica) non è che non sono indipendenti i contatti dello stesso soggetto, il punto è che la variabilità tra i soggetti mi pare vada considerata in altro modo. in altre parole: non mi sembra un random effect ‎- emme
In che senso di convince poco dal punto di vista logico? ‎- Silent
(per la cronaca, la variabilità dei soggetti è minima. però non è una cosa che posso scrivere su un paper, "guarda, fidati, è così") Ma comunque in letteratura è normale fare statistiche su contatti di soggetti diversi, è in realtà l'unica cosa che puoi fare. Quello che fanno in letteratura, in maniera non molto accurata, è l'ANOVA. ‎- Silent
allora, il quesito "c'è un effetto modalità?" ha senso, quello "c'è un effetto localizzazione?" già meno. sono risposte che tu raccogli in diversi siti (come gli ERP frontali o posteriori, per intenderci), siti in cui vai a controllare se permane o meno l'effetto modalità che stai manipolando ‎- emme
non capisco come fai a trattare il posizionamento degli elettrodi come fattore indipendente, quando a me pare essere la tua variabile dipendente ‎- emme
non ho capito ‎- Silent
riformulo: il quesito "c'è un effetto localizzazione" ha senso se riferito a qualcos'altro, vale a dire: in funzione del tipo di stimolazione che fornisco, ho effetti diversi anteriormente vs posteriormente? ‎- emme
Non è la mia variabile dipendente. Oh, a me serve vedere se le risposte anteriori sono più grandi di quelle posteriori (in realtà, ipotizzo che non lo siano). Quindi location è il mio fattore. Il fatto che non lo decida io, non lo rende meno un fattore. ‎- Silent
No, io non sto guardando solo l'interazione Location x Modality. Anche il main effect di Location mi interessa. ‎- Silent
(comunque: quello che fa il mixed model è modificarmi l'intercetta e lo slope per ciascun singolo soggetto: quindi delle differenze tiene conto eccome) ‎- Silent
ok, già ipotizzare che non lo siano rende il modello molto fragile, con l'errore di II tipo in bella vista. comunque, tu vuoi confrontare l'ampiezza (posso usare ampiezza?) della risposta anteriore vs. posteriore, ergo abbiamo un quesito squisitamente neurofisiologico? e in condizioni di mancata stimolazione (attività basale), esistono diffrenze? ‎- emme
(poi, oh, sicuramente ti sto sviando, quindi smetto di dirti cose che certamente non sono inerenti il tuo problema) ‎- emme
Io mi aspetto un main effect di Modality e nessun effect di Location. Che è quello che in effetti ottengo con l'ANOVA. Il quesito è neurofisiologico. Sto paragonando la magnitudine di oscillazioni gamma. In condizioni di mancata stimolazione non esistono differenze. Però qui non stiamo parlando di statistica. Cioè, a SPSS non frega nulla di cosa sto misurando. Il fatto che la matrice hessiana sia negativa deve dipendere da qualcos'altro. ‎- Silent
senza dubbio, ti chiedevo dell'impianto logico per capire come sono impostati i dati e come trattare le matrici (se non capisco, non riesco a ragionare sui dati), ma è un problema mio, davvero non voglio farti perdere tempo ‎- emme
no, ma sono io che sto facendo perdere tempo te :) ‎- Silent
Nel senso che capisco che non sia semplice / intuitivo / interessante. Quindi se non ti è mai capitato, no problem. Torturerò qualcun altro con i miei dubbi :D ‎- Silent
sto cercando di capire cosa ti dica la matrice hessiana negativa. in verità, mi pare più problematico il fatto che ti dia lo stesso SE (ho capito bene?) per tutte le condizioni ‎- emme
Eh, ma lo stesso SE me lo dà (inaspettatamente) per tutte le condizioni di Modality. Non per Location, che è la mia variabile problematica. ‎- Silent
(comunque, l'ANOVA ti ha di fatto già detto che hai un effetto modalità, che resta costante nelle diverse localizzazioni?) ‎- emme
Location l'hai inserito in colonna, Modality in riga? ‎- emme
Ad occhio, ha a che fare con il fatto che il LMM esegue delle iterazioni (mi sembra 100). Secondo me si incasina nelle iterazioni. Perché poi, se al di fuori delle analisi, gli chiedo la tabella descrittiva, gli SE e le medie me le dà giuste. ‎- Silent
No, sono due colonne. Le righe sono i contatti. ‎- Silent
(ma questo è come li vuole SPSS, magari altri programmi vogliono una struttura diversa) ‎- Silent
Quindi le mie colonne sono: Contacts, Subject, Modality, Location, GBO responses ‎- Silent
no, aspetta. se tratti i contatti come "soggetti", se allo stesso contatto vengono applicate due o più modulazioni, non possono non essere nella stessa riga O_o ‎- emme
Se facessi un'ANOVA. Ma non sto facendo un'ANOVA. ‎- Silent
Quindi il contatto si ripete nella riga. È la versione "long". Aspetta che avevo una slide esplicativa in proposito. ‎- Silent
ma il LMM non condivide l'assunto del fattore ripetuto? ‎- emme
come vedi, lì ripetono i soggetti nelle righe ‎- Silent
Eh, esatto. L'esempio del pdf è il fattore ripetuto. ‎- Silent
no, aspetta, a pag 4 trovo esempi relativi a genere ed età ‎- emme
sono misure ripetute: il soggetto ha prima 10 anni, poi 12, poi 14 ‎- Silent
ok, visto a pagina 3, è l'esempio delle visite, 3 per soggetto? ‎- emme
e come vedi il soggetto è in colonna, e lo stesso soggetto è ripetuto più volte ‎- Silent
sìsì, visto ora ‎- emme
ecco sì (scusa, per me era pagina 4) ‎- Silent
però lì c'è un quesito per il quale l'età (che è la variabile di cui vuoi vedere l'effetto) cambia nel tempo ‎- emme
Quindi i miei dati sono strutturai così. Visto che ogni contatto viene stimolato con 4 modalità diverse, è ripetuto 4 volte. (Ovviamente la location invece è costante) ‎- Silent
Per me ciò che cambia è la modalità di stimolazione, ma è la stessa cosa. La mia repeated measure sono le stimolazioni diverse ‎- Silent
(non è uno studio longitudinale, ma è lo stesso modello) ‎- Silent
quindi ho prima riga: contatto1, stim1, loc1, risposte. seconda riga: contatto1, stim2, loc1, etc. ‎- Silent
Però questo sono sicura che sia corretto. E infatti poi quando costruisco il modello non ho problemi nell'inserire le variabili. Secondo me ciò che sbaglio è la matrice di covarianza, che lascio come default, ma sulla quale deve esserci un UNIVERSO dietro ‎- Silent
che la modalità sia il fattore ripetuto è chiarissimo, e ho capito come hai inserito i dati. mi chiedo solo se sia l'analisi corretta, proprio in funzione del fatto che nell'esempio hai una variabile a intervalli che cambia nelle diverse osservazioni (al di là del fatto che sia uno studio longitudinale), mentre tu hai una classificazione esclusivamente categoriale (è solo un quesito mio, sicuramente sbagliato) ‎- emme
è, ma infatti stavo arrivando lì, mi sembra che la covarianza si possa "inghippare" proprio perché non trova niente da covariare ‎- emme
Ah, su questo pure ho letto parecchie cose. Essendo categoriale, va considerato come fattore. Fosse stato continuo, l'avrei dovuta inserire come covariata. Quindi anche su questo sono (ero) abbastanza tranquilla. ‎- Silent
L'esempio del manuale era il divorzio dei genitori, quindi categoriale ‎- Silent
eh, ok, stavo dicendo esattamente questo (scusa, ripercorro il procedimento) ‎- emme
mi spiace :( ‎- emme
(comunque -problema mio- fatico a capire come costruisca la matrice di covarianza) ‎- emme
(ma mi sa problema di tutti) ‎- Silent
nel senso che ho chiesto anche un altro collega "esperto", il quale non ha saputo darmi una risposta. Pur considerando corretta la mia procedura. ‎- Silent
Posso provare a fingere che i 4 livelli siano continui e non categoriali, giusto per vedere se il problema è quello (tanto sono numerati da 1 a 4). Se la matrice non viene negativa, allora è colpa del categoriale. ‎- Silent
Però effettivamente una delle matrici selezionabili potrebbe essere adatta alle variabili categoriali. Magari l'inghippo è davvero lì. ‎- Silent
Faccio qualche tentativo. Thanks. ‎- Silent
poi dimmi ‎- emme
matrice non positiva, anche se gli spaccio il categoriale come continuo, quindi il problema non è quello ‎- Silent
(ma non c'è invece un modo per adattare le matrici alle variabili categoriali?) ‎- emme
Era ciò che speravo, ma selezionare altri tipi di matrice sembra solo peggiorare la situazione (non ho proprio più convergenza). Forse il problema è che SPSS è rigido. Con SAS / R potrebbe essere una cosa programmabile. ‎- Silent
Comunque ho scoperto che la mia università fornisce un servizio di statistica gratuito, nel senso che ti fanno discutere con un esperto a patto che tu lo includa nei ringraziamenti dell'articolo. Penso proprio che farò così, in modo da non rischiare di fare cavolate (e vederci un po' più chiaro) ‎- Silent
Attenzione attenzione: è NORMALE che gli errori standard dell'output siano tutti uguali per Modality. L'errore standard nei mixed models viene stimato in maniera diversa che in un modello classico, quindi quando hai un fattore bilanciato, come in questo caso, stima un errore standard unico per tutti (di cui in soldoni posso fregarmene, perché io riporterò quello reale). ‎- Silent
E per quanto riguarda la matrice non positiva, è tale se considero il fattore random sia sull'intercetta che sullo slope. Se invece lo includo solo nell'intercetta, il modello converge. ‎- Silent
(certo, la matematica che c'è dietro per me è una black box) ‎- Silent
Qui la spiegazione sull'uguaglianza degli errori standard: http://stats.stackexchange.com/questions/170018/equal-standar... ‎- Silent
leggo soltanto ora, grazie :) ‎- emme
Lunedì incontro la super-esperta di mixed models (una del servizio gratuito della mia università). Spero di capirne ancora di più :) ‎- Silent