Corrente’den Lambert Strether tarafından.
Bu gönderi teneke üzerinde ne yazıyorsa onu yapacak ve yapacağı tek şey bu. Ne yazık ki, genomik yazılım dokümantasyonu ile kafa karışıklığı yaşamama durumunu aktif olarak takip ettim, ancak birkaç saat çalıştıktan sonra, temel bilgiler bile beni aşıyor. Dolayısıyla bu yazıda genomikle ilgili neredeyse hiçbir şey olmayacak (“Gözlerim kararıyor.”) Ben sadece genomik sürveyans yapılmasını sağlayan kurumlara odaklanacağım. Önce CDC’nin ilgili sanat terimlerini tanımlamasına izin vereceğim. CDC’den, “Genomik Gözetim nedir?“:
- mutasyon: Mutasyon, bir virüsün genomundaki (genetik kod) tek bir değişikliği ifade eder. Mutasyonlar sıklıkla meydana gelir, ancak yalnızca bazen virüsün özelliklerini değiştirir.
- soy: Bir soy, ortak bir ataya sahip yakından ilişkili bir virüs grubudur. SARS-CoV-2’nin birçok soyu vardır; hepsi COVID-19’a neden olur.
- varyant: Bir varyant, bir veya daha fazla mutasyon içerebilen bir viral genomdur (genetik kod). Bazı durumlarda, benzer genetik değişikliklere sahip bir varyant grubu, örneğin bir soy veya soy grubu, halk sağlığı kuruluşları tarafından bir varyant olarak belirlenebilir. endişe varyantı (VOC) veya bir ilgi varyantı (VOI) halk sağlığı eylemini gerektirebilecek ortak nitelikler ve özellikler nedeniyle.
- Genomik Dizileme: Bilim adamları, bir organizmada veya virüste bulunan genetik materyali deşifre etmek için genomik dizileme adı verilen bir süreç kullanırlar. Örneklerden alınan diziler, bilim insanlarının bir virüsün yayılmasını, nasıl değiştiğini ve bu değişikliklerin halk sağlığını nasıl etkileyebileceğini izlemesine yardımcı olmak için karşılaştırılabilir.
- Genomik Gözetim: Virüsler, CDC ve ortakları tarafından toplanan genomik dizi verileri kullanılarak izlenebilir. Etkili sürveyans, her COVID-19 vakasından bir numunenin sıralanmasını gerektirmez. Bunun yerine bilim insanları, yeni değişkenleri saptamak ve dolaşımdaki değişkenlerdeki eğilimleri izlemek için temsili popülasyonlardan yeterli dizi verisi toplamaya güveniyor.
Bizim amaçlarımıza göre (yani, saf bilim değil) genomik dizileme, kişinin genomik sürveyansa hazırlanmak için yaptığı şeydir. CZ GEN EPI, Yardım Merkezinde daha fazla açıklıyor:
Gözetim çabalarını kolaylaştırmak için, yakından ilişkili olan ve imza mutasyonlarını (genetik değişiklikler) paylaşan SARS-CoV-2 virüsleri soylar veya varyantlar aracılığıyla izlenir. Bir soy, ortak bir atadan evrimleşen ve dolayısıyla genetik geçmişi paylaşan, yakından ilişkili bir virüs grubudur. Bir varyant, 2019’da tespit edilen orijinal SARS-CoV-2 virüsüne göre mutasyonları olan bir virüsü ifade eder. Belirleyici bir dizi mutasyona sahip belirli varyantlar, halk sağlığı açısından diğerlerinden daha önemli olabilir. Bu nedenle SARS-CoV-2 varyantları Pango, Nextstrain ve GISAID tarafından adlandırılmış ve izlenmiştir. Bu platformların her biri, belirli virüs mutasyonlarını vurgulayan kendi isimlendirme sistemine sahiptir, ancak Pango soyu ve Nextstrain sınıf isimlendirmeleri en yaygın kullanılanlardır. Belirli bir varyantın halk sağlığı tehdidi olduğu, yani ‘endişe varyantları’ (VOC) olduğu gösterildiğinde, Yunan alfabesine (Alfa, Beta, Gamma, Delta, vb.) göre adlandırılır. Dünya Sağlık Örgütü (WHO), VOC’yi etiketlemek için bu Yunanca harfli isimlendirme sistemini kullanır ve bu, SARS-CoV-2 dinamiklerini ve halk sağlığı tepkilerini genel izleyicilerle tartışmayı kolaylaştırır.
Yani GISAID, Pango ve NextStrain en önemli kurumlar. Önce bu sırayla onlara bakacağım, ne yaptıklarına dair anlamsız bir şekilde üst düzey bir tanım sunacağım, sonra her birinin kurumsal sorunlarına işaret edeceğim. Kısa bir rantla bitireceğim.
GISAID
İtibaren GISAID Hakkında sayfası:
GISAID Girişimi, tüm influenza virüslerinden ve COVID-19’a neden olan koronavirüsten gelen verilerin hızlı paylaşımını teşvik eder. Bu, araştırmacıların salgınlar ve pandemiler sırasında virüslerin nasıl geliştiğini ve yayıldığını anlamalarına yardımcı olmak için genetik diziyi ve insan virüsleriyle ilişkili klinik ve epidemiyolojik verileri ve kuş ve diğer hayvan virüsleriyle ilişkili coğrafi ve türe özgü verileri içerir.
GISAID bunu, resmi yayınlanmadan önce virolojik verilerin paylaşılmasını engelleyen veya caydırıcı engelleri ve kısıtlamaları aşarak yapar.
Girişim, GISAID’deki verilere açık erişimin, kendilerini tanımlamayı kabul eden ve Veritabanı Erişim Anlaşması aracılığıyla yönetilen GISAID paylaşım mekanizmasını desteklemeyi kabul eden tüm bireylere ücretsiz olarak sağlanmasını sağlar.
(GISAID, Kuş Gribi Verilerini Paylaşma Küresel Girişimi anlamına gelir. Açıkça gribin ötesine geçmiştir.)
GISAID’in, pandeminin en başından beri arşiv işlevini çok iyi yerine getirdiği açıktır:
Bugün, GISAID’in Çin CDC’den “Bu yeni bir koronavirüs” olduğunu öğrendiğinin 1. yıldönümü.
36 saat sonra virüsün ilk genom dizisi GISAID’e gönderilerek dünyaya duyuruldu. Bu veri paylaşımı? teşhis testlerini ve aşı geliştirmeyi etkinleştirdi. benzeri görülmemiş bir hızda.
— Vaughn Cooper (@vscooper) 8 Ocak 2021
Kudos verildi, Wikipedia (üzgünüm) açıklıyor GISAID’in yönetişimi:
GISAID’in idari işleri bir kurul tarafından denetlenmektedir.[46] Peter Bogner ve Alman avukatlar Jörg Paura ve Christoph Wetzler’den oluşuyor. Girişimin bilimsel gözetimi, DSÖ Grip için İşbirliği Yapan altı Merkezin tamamı dahil olmak üzere önde gelen halk sağlığı laboratuvarlarının yöneticilerinden ve Dünya Hayvan Sağlığı Örgütü ve Dünya Hayvan Sağlığı Örgütü için kuş gribi araştırmaları için hayvan sağlığı referans laboratuvarlarının yöneticilerinden oluşan Bilimsel Danışma Konseyinden gelmektedir. Birleşmiş Milletler Gıda ve Tarım Örgütü.
DSÖ ve aerosol bulaşma ile ilgili korkunç deneyimlerimizden sonra, DSÖ ağırlıklı herhangi bir organizasyona şüpheyle yaklaştığımı söylemeliyim. Ve ikisi avukat olan sadece üç kişiden oluşan bir kurul, herhangi bir kurul? Bilmiyorum…. Ancak asıl meseleler yönetişim ve erişimdir. İtibaren Ekonomist:
[T’his small non-profit organisation is a mighty force in the storage and sharing of genetic data about pathogens…. GISAID has received millions of dollars from the Rockefeller Foundation, a philanthropic organisation; the World Health Organisation (who); and the Coalition for Epidemic Preparedness Innovations, a foundation that funds vaccine research. It has also received donations from pharmaceutical companies. In the first year of the pandemic, the who gave GISAID $1.7m; pharmaceutical firms gave another $1.7m. Donations have continued to roll in, enabling the platform to scale up. By April 2021, 1m coronavirus sequences had been posted to GISAID. In June 2021 the Rockefeller Foundation gave it another $5.1m.
That’s not very much money, in the great scheme of things. More:
Some funders worry about a lack of transparency in the governance of GISAID, especially over the identity of its board members. One funding organisation which asked to remain anonymous describes GISAID as “opaque”. Many, though, understand the organisation to be run mostly by one man: Peter Bogner, its founder. Mr Bogner, a former television-studio executive, is understood to be based in California. (GISAID also has an administrative base in Germany run by a charity, Freunde von GISAID. e.V., or “Friends of GISAID”.)
Nothing sketchy there! (The Economist also says that it’s Big Pharma that’s raising the “transparency” issue, so, er….) And then there’s the question of how open the access really is. Still from the Economist:
On March 21st it emerged that GISAID had revoked the access of a group of international scientists who had been working on Chinese covid data. The argument centred on a dispute over whether they had broken the rules governing use of the database. Their access has since been restored. But the row inspired other scientists to say that they had also had their access to GISAID removed, hampering public-health work.
For example:
Angie Hinrichs, a researcher at the University of California, Santa Cruz, is among those scientists who had her access to GISAID genomic sequences restricted without explanation. Her limited access obliged her to spend 750 hours downloading sequences in tiny chunks during the pandemic, she says.
And:
Bede Constantinides, a senior researcher at the University of Oxford, says that during covid he worked on a system that automated the reporting of lab sequence data. When he asked GISAID if his system could be made to talk to its one—so that data from Britain’s National Health Service could be shared automatically—he received no reply and had his account blocked from uploading to GISAID. GISAID is now “mostly useless” to him, he says, adding that his emails continue to go unanswered. Many scientists say they fear taking their complaints public in case they lose access to the database.
It would be bad if GISAID were undergoing a proces of enshittificiation, like so many other online platforms:
Here is how platforms die: First, they are good to their users; then they abuse their users to make things better for their business customers; finally, they abuse those business customers to claw back all the value for themselves. Then, they die.
It does seem, from the testimony of Hinrichs and Constantinides, that GISAID is abusing its lockin. If so, can and will another platform arise? We shall see.
Nextstrain
Here is how Nextstrain defines itself:
Nextstrain is an open-source project to harness the scientific and public health potential of pathogen genome data. We provide a continually-updated view of publicly available data alongside powerful analytic and visualization tools for use by the community.
Nextstrain provides an open-source toolkit enabling the bioinformatics and visualization you see on this site. Tweak our analyses and create your own using the same tools we do. We aim to empower the wider genomic epidemiology and public health communities.
Here is NextStrain’s workflow, according to a presentation at CDC:
As you can see, the workflow begins at the left a Covid genetic sequence, generally from GISAID. The sequence is then “munged” (technical term) into “reproducible bioinformatics” and displayed to the user. The visualization looks like this:
Remember Angie Hinrichs? Here she is again, performing the key role in the “munging”:
Time for a long overdue shoutout to one of the unsung heroes of the pandemic—@AngieSHinrichs, the keeper of the @NextStrain SARS-CoV-2 phylogenetic tree. 1/9 pic.twitter.com/OMz1QaMNMy
— Ryan Hisner (@LongDesertTrain) April 9, 2023
And:
Many sequences are full of errors, some of which are really common, & without these errors being masked by @AngieSHinrichs (& maybe others I don’t know about, like @firefoxx66?) , the tree would be riddled with errors and hard to make sense of. 7/9
— Ryan Hisner (@LongDesertTrain) April 9, 2023
So the NextStrain SARS-CoV-2 phylogenetic tree is the editorial product of one person, hopefully never hit by a bus and hopefully never succumbing to Covid brain fog. That, to me, is an institutional weakness.
Pango
Pango is a second open source project, although with an entirely different classificaiton system from NextStrain. BMC Genomics:
The Pango dynamic nomenclature is a popular system for classifying and naming genetically-distinct lineages of SARS-CoV-2, including variants of concern, and is based on the analysis of complete or near-complete virus genomes.
I can’t find a pretty workflow diagram for Pango, but their software page makes the workflow evident:
Sequence input from (most likely) GISAID; “munging” in Pangolin; visualization in Pando.
Pango is the system the CDC uses to update its more-or-less weekly variant charts. And Pango has exactly the same institutional weakness as NextStrain. As I wrote back in October 2022:
Now let’s look at the institutional set-up for Pangolin (and please note that I have nothing but the utmost respect for the skills of the developers, or the power and beauty of their work). From MIT Technology Review:
[the Pangolin project is] öncelikle İskoçya’daki bir doktora öğrencisi tarafından yönetilen, dünyanın dört bir yanından çalışan bir GitHub sayfası.
Bu gönüllüler, küresel covid araştırması için sessizce temel hale gelen Pango adlı bir sistemi denetliyor. Yazılım araçları ve adlandırma sistemi, dünya çapındaki bilim adamlarının yaklaşık 2,5 milyon virüs örneğini anlamalarına ve sınıflandırmalarına yardımcı oldu.
Dünyanın dört bir yanındaki araştırmacılar, halk sağlığı görevlileri ve gazeteciler, covid’in evrimini anlamak için Pango’yu kullanıyor. Ama çok azı bunun farkında.
Kovid genomlarını izlemeye yönelik temel araçların çoğu, son bir buçuk yılda O’Toole ve Scher gibi kariyerinin başındaki bilim adamları tarafından geliştirildi ve sürdürüldü. Dünya çapında covid işbirliğine duyulan ihtiyaç patladığında, bilim adamları bunu Pango gibi geçici altyapıyla desteklemek için koştu. Bu işlerin çoğu, 20’li ve 30’lu yaşlarındaki teknoloji meraklısı genç araştırmacılara düştü. Gayri resmi ağları ve açık kaynaklı araçları kullandılar; yani kullanmakta özgürlerdi ve herkes ince ayarlar ve iyileştirmeler eklemek için gönüllü olabilirdi.
UC Santa Cruz’da biyoenformatikçi olan ve bu yılın başlarında projeye katılan Angie Hinrichs, “Yeni teknolojilerin en ileri noktasındaki insanlar genellikle yüksek lisans öğrencileri ve doktora sonrası öğrenciler oluyor” diyor.
Bu nedenle, açık olmak gerekirse, CDC, varyant tespiti için temel teknolojiyi dış kaynak olarak kullandı. gönüllüler[5]. (“Mezun öğrenciler ve doktora sonrası öğrencilerin” temel özelliği nedir? Devam etmeleri gerekir.) CDC binlerce, belki de on veya yüzbinlerce hayatı üzerine bahse girdi. gönüllüler. Bu size mantıklı bir yaklaşım gibi geliyor mu? Neden CDC onlara bir çeşit bütçe bulamıyor? Geliştirici daha iyi bir teklif aldığında ne olur? Yoksa başka bir kuruma mı taşınıyor? CDC’deki insanlar, karmaşık açık kaynaklı yazılımların küçük elfler tarafından sürdürüldüğünü düşünüyor mu? Bu size operasyonel kapasite gibi geliyor mu?
Hayır.
Çözüm
GISAID’in açık erişimi her zaman açık değildir ve aslında iki bilim insanının erişimini hiçbir sebep görmeden kapatıyorlar. Ve belki de sebebini göremiyorum çünkü GISAID’in operasyonları “opak”. GISAID’in aşağısındaki iki temel projeden Pango, küçük bir gönüllü ekibine (!!) ve Nextstrain bir kişinin iyileştirme çabalarına (!!!) bağlıdır. Zayıf, zayıf ve zayıf. Tehlikeli, tehlikeli, tehlikeli. Ne oluyor eğer genom dizileme araçları çöktüğünde ve genomik sürveyans gerçekleşemediğinde, yeni bir değişken geometrik olarak çoğaldığında? Eğer bu olduğunda, bir hafta kaybetmeyi göze alamayız!
Bu yüzden PMC, Silikon Vadisi’nin rantiye hizmeti veren işçi aristokratları artık bedava masajlar veya trüf mantarlı vegan stilleri alamayacakları için inleyip ellerini ovuştururken veya siyasi sınıf Azakları gönderemeyeceğimiz için aklını kaybederken Ukrayna’da parçalara ayırıp karaborsada satmaya yetecek kadar tank, milyonlarca hayatın bağlı olduğu işi yapan gerçek bilim adamları karşıdan karşıya geçmeden önce iki tarafa da bakmalı. Ne bir durum. Bu arada, Rockefeller vakfındaki bir beyin dehası bir ondalık noktayı yanlış yerleştirdi. Sanırım koltuk minderlerinin altına baktıkları için bir milyon dediler, ama on milyon biraz fazlalık satın alabilirdi. Belki yüz milyonlar, donuk normallerin kullanabileceği bir teknoloji doktoru satın alırdı, kim bilir. Bu insanların nesi var?