Excel Excel

Pagina 1 di 2 12 UltimaUltima
Risultati da 1 a 20 di 29

Discussione: Excel

  1. #1
    Major Sludgebucket (ABS)
    Guest

    Excel

    A third of all genetics papers published in Nature over a decade (and 20% across all journals) had errors due to the fact that many genes have names like SEPT2 (the official name of Septin 2), which were automatically coded as dates by Microsoft Excel. https://twitter.com/kgong/status/1370616101474758657

    Scientists rename human genes to stop Microsoft Excel from misreading them as dates https://www.theverge.com/2020/8/6/21...sreading-dates

  2. #2

    Re: Excel

    O magari potrebbero fare lo sforzo di imparare ad usare strumenti pensati appositamente per fare ricerca seriamente.

  3. #3
    北斗のバド・スペンサー L'avatar di Lo Zio
    Data Registrazione
    Jan 2016
    Messaggi
    75.435

    Re: Excel

    basta semplicemente impostare correttamente il formato dati della cella

  4. #4
    Disagio&Disagi, Inc. L'avatar di Moloch
    Data Registrazione
    Jan 2016
    Messaggi
    15.108

    Re: Excel

    Citazione Originariamente Scritto da Lo Zio Visualizza Messaggio
    basta semplicemente impostare correttamente il formato dati della cella
    il problema è il passaggio xlsx -> csv -> xlsx che fa perdere tutte le formattazioni

    - - - Aggiornato - - -

    Citazione Originariamente Scritto da Kraven VanHelsing Visualizza Messaggio
    O magari potrebbero fare lo sforzo di imparare ad usare strumenti pensati appositamente per fare ricerca seriamente.
    per il mero data entry purtroppo ancora excel è impareggiabile.
    ovviamente le elaborazioni le fai altrove.

  5. #5

    Re: Excel

    Citazione Originariamente Scritto da Lo Zio Visualizza Messaggio
    basta semplicemente impostare correttamente il formato dati della cella
    Da quel che ho visto, bioinformatici a parte, gli altri ricercatori di ambito life sciences sono fortemente a disagio con statistica, matematica e strumenti informatici.
    "Imparano" il minimo indispensabile per sfangarla.

    E dato che questo difetto appartiene sia a chi scrive articoli, sia ai "peers" che li "controllano" prima dell'agognata pubblicazione... un gran numero di errori rimangono undetected.
    E' davvero grottesco.

  6. #6
    北斗のバド・スペンサー L'avatar di Lo Zio
    Data Registrazione
    Jan 2016
    Messaggi
    75.435

    Re: Excel

    Citazione Originariamente Scritto da Moloch Visualizza Messaggio
    il problema è il passaggio xlsx -> csv -> xlsx che fa perdere tutte le formattazioni
    ok pace. però quando stai analizzando dati dovresti almeno avere idea di cosa stai analizzando... altrimenti siamo al "i have no idea what i am doing"

  7. #7
    Disagio&Disagi, Inc. L'avatar di Moloch
    Data Registrazione
    Jan 2016
    Messaggi
    15.108

    Re: Excel

    Citazione Originariamente Scritto da Lo Zio Visualizza Messaggio
    ok pace. però quando stai analizzando dati dovresti almeno avere idea di cosa stai analizzando... altrimenti siamo al "i have no idea what i am doing"
    mi sa che non hai idea della dimensione dei dataset di genomica.

  8. #8

    Re: Excel

    Citazione Originariamente Scritto da Lo Zio Visualizza Messaggio
    ok pace. però quando stai analizzando dati dovresti almeno avere idea di cosa stai analizzando... altrimenti siamo al "i have no idea what i am doing"

  9. #9
    北斗のバド・スペンサー L'avatar di Lo Zio
    Data Registrazione
    Jan 2016
    Messaggi
    75.435

    Re: Excel

    Citazione Originariamente Scritto da Moloch Visualizza Messaggio
    mi sa che non hai idea della dimensione dei dataset di genomica.
    no ovviamente, mai visto uno a questo punto andrebbe quindi ottimizzata la struttura o quella roba lì

    un problema grosso si può scomporre in problemi piccoli

  10. #10
    Disagio&Disagi, Inc. L'avatar di Moloch
    Data Registrazione
    Jan 2016
    Messaggi
    15.108

    Re: Excel

    Citazione Originariamente Scritto da Lo Zio Visualizza Messaggio
    no ovviamente, mai visto uno a questo punto andrebbe quindi ottimizzata la struttura o quella roba lì

    un problema grosso si può scomporre in problemi piccoli
    no, i dataset genomici spesso hanno centinaia di variabili.
    "ottimizzare la struttura" non esiste ed è una semplicistica semplificazione da ingegnere: se devi elaborare analisi statistiche su quei dati lì cosa cazzo vuoi "ottimizzare"?

  11. #11
    北斗のバド・スペンサー L'avatar di Lo Zio
    Data Registrazione
    Jan 2016
    Messaggi
    75.435

    Re: Excel

    beh ottimizzi, o quanto meno rendi cosciente chi fa le cose, che se devi analizzare delle date (gg.mm.aaaa) e dentro trovi "pere mele arance" magari qualcosa non torna


  12. #12
    Army of One L'avatar di golem101
    Data Registrazione
    Jan 2016
    Località
    lungo il passaggio di Nord-Ovest
    Messaggi
    13.135

    Re: Excel

    E qui ragazzi e meno giovani, avete un esempio diretto delle tre risposte standard dell'ingegnere:
    1. è impossibile/hai sbagliato
    2. dipende
    3. non è un problema mio

  13. #13
    A punto & a capo L'avatar di Napoleoga
    Data Registrazione
    Aug 2016
    Messaggi
    9.994

    Re: Excel

    Citazione Originariamente Scritto da golem101 Visualizza Messaggio
    E qui ragazzi e meno giovani, avete un esempio diretto delle tre risposte standard dell'ingegnere:
    1. è impossibile/hai sbagliato
    2. dipende
    3. non è un problema mio
    Non esiste risposta corretta che non sia anticipata da un dipende

  14. #14
    Disagio&Disagi, Inc. L'avatar di Moloch
    Data Registrazione
    Jan 2016
    Messaggi
    15.108

    Re: Excel

    Citazione Originariamente Scritto da Lo Zio Visualizza Messaggio
    beh ottimizzi, o quanto meno rendi cosciente chi fa le cose, che se devi analizzare delle date (gg.mm.aaaa) e dentro trovi "pere mele arance" magari qualcosa non torna

    quando importi da csv un dataset 300*300.000 è molto efficiente andare a vedere in giro dove i geni informatici della microsoft hanno deciso di sputtanarti i contenuti di cella.

    che poi hai capito l'esatto contrario: il problema di excel è che ti riconosce come data tutto quello che in realtà data non è, non c'è modo di disabilitare questo orrore di default e se cambi manualmente il formato di cella in dataset importati da data a testo o a numero ti viene restituita la codifica nativa, cioè il numero di giorni trascorsi dal 1 gennaio 1900, perdendo totalmente l'informazione originaria.

    una programmazione da scimmie spastiche.
    Ultima modifica di Moloch; 17-03-21 alle 12:07

  15. #15
    Army of One L'avatar di golem101
    Data Registrazione
    Jan 2016
    Località
    lungo il passaggio di Nord-Ovest
    Messaggi
    13.135

    Re: Excel

    Taaaaaac! (cit.)

  16. #16
    北斗のバド・スペンサー L'avatar di Lo Zio
    Data Registrazione
    Jan 2016
    Messaggi
    75.435

    Re: Excel

    Citazione Originariamente Scritto da golem101 Visualizza Messaggio
    E qui ragazzi e meno giovani, avete un esempio diretto delle tre risposte standard dell'ingegnere:
    1. dipende
    così è corretto

    - - - Aggiornato - - -

    mi fa piacere che in una discussione generica si finisca sempre a insultare

  17. #17

    Re: Excel

    https://www.theregister.com/2020/08/...el_gene_names/

    "There are lots of better alternatives," Neil Saunders, a data scientist who sounded the alarm about genetic mishaps with Excel back in 2012, told The Register today. "But Excel is on their computers and they feel familiar with it, even if they can't actually use it properly. Biologists in particular are reluctant to invest time in learning programming skills."

    [...]

    "It's often pointed out that the problem is entirely avoidable, by setting Excel column type when importing CSV files," Saunders told us. "But no one does this – they just click on a file name, it opens in Excel – boom, the damage is done." He blames Microsoft for the blunders. "Really I think the issue is that non-explicit auto-conversion of data types is a bad default software behavior."

    "Personally I think that changing the gene symbols is not a great solution," Saunders told us. "But given that Microsoft won't change its default Excel behavior and 16-plus years of attempts to educate biologists on the issue have failed, I suppose it is a practical solution."
    e persino dall'articolo di verge nel primo post

    There’s no easy fix, either. Excel doesn’t offer the option to turn off this auto-formatting, and the only way to avoid it is to change the data type for individual columns. Even then, a scientist might fix their data but export it as a CSV file without saving the formatting. Or, another scientist might load the data without the correct formatting, changing gene symbols back into dates. The end result is that while knowledgeable Excel users can avoid this problem, it’s easy for mistakes to be introduced.
    Ultima modifica di Kraven VanHelsing; 17-03-21 alle 12:29

  18. #18
    Senior Member L'avatar di tigerwoods
    Data Registrazione
    Jan 2016
    Messaggi
    19.455

    Re: Excel

    Citazione Originariamente Scritto da Moloch Visualizza Messaggio
    quando importi da csv un dataset 300*300.000 è molto efficiente andare a vedere in giro dove i geni informatici della microsoft hanno deciso di sputtanarti i contenuti di cella.

    che poi hai capito l'esatto contrario: il problema di excel è che ti riconosce come data tutto quello che in realtà data non è, non c'è modo di disabilitare questo orrore di default e se cambi manualmente il formato di cella in dataset importati da data a testo o a numero ti viene restituita la codifica nativa, cioè il numero di giorni trascorsi dal 1 gennaio 1900, perdendo totalmente l'informazione originaria.

    una programmazione da scimmie spastiche.
    non mi é chiaro perché usare proprio excel, importa il csv in matlab e hai zero problemi.

  19. #19
    Utente di Cinisello L'avatar di Glasco
    Data Registrazione
    Jan 2016
    Messaggi
    20.684

    Re: Excel


  20. #20
    Disagio&Disagi, Inc. L'avatar di Moloch
    Data Registrazione
    Jan 2016
    Messaggi
    15.108

    Re: Excel

    Citazione Originariamente Scritto da tigerwoods Visualizza Messaggio
    non mi é chiaro perché usare proprio excel, importa il csv in matlab e hai zero problemi.
    in genere arrivano csv già sformattati

Permessi di Scrittura

  • Tu non puoi inviare nuove discussioni
  • Tu non puoi inviare risposte
  • Tu non puoi inviare allegati
  • Tu non puoi modificare i tuoi messaggi
  •  
Chi Siamo
Forum ufficiale della rivista
The Games Machine
Seguici su