Koti ominaisuudet Nämä kannattajat haluavat varmistaa, että tietomme eivät katoa

Nämä kannattajat haluavat varmistaa, että tietomme eivät katoa

Sisällysluettelo:

Video: Ohjelma urheilua varten (Marraskuu 2024)

Video: Ohjelma urheilua varten (Marraskuu 2024)
Anonim

Tämän vuoden toukokuun lopulla, tarkalleen viiden kuukauden kuluttua Yhdysvaltojen 45. presidentin vihityksestä, ryhmä ihmisiä, jotka olivat kiinnostuneita uuden hallinnon asenteesta tieteen ja ilmastonmuutoksen suhteen, vietti oman erityisen vuosipäivän.

Ei kaukana Pohjois-Texasin yliopiston kampuksesta, Dallasin pohjoisosassa, useita kymmeniä henkilöitä tapasi Data Rescue Dentonissa tunnistaakseen ja ladataksesi kopioita liittovaltion ilmasto- ja ympäristöaineistoista. Nämä hackathon-tyyliset kokoontumiset saivat paljon huomiota aloitusta välittömästi edeltävinä päivinä; Denton oli 50. tällainen tapahtuma tammikuun jälkeen.

Järjestettyään aluksi huolta siitä, että uusi hallinto saattaa poistaa tai hämärtää ilmasto- ja muita ympäristötietoja, tietojen pelastajien pahimmat pelot näyttivät toteutuvan, kun yksi Trumpin Valkoisen talon ensimmäisistä toimista oli poistaa ilmastomuutossivut verkkosivustolta. Sitten Yhdysvaltain maatalousministeriö poisti eläinsuojelua koskevia tarkastusraportteja verkkosivustolta ja vastasi National Geographic Information Freedom Act -pyyntöön 1 771 sivulla kokonaan muokattua materiaalia.

Kuka tahansa voi käyttää yli 153 000 liittovaltion tietojoukkoa keskushallinnon avoimen datan portaalin kautta osoitteessa data.gov. Mutta se on vain murto-osa julkisen hallinnon byrokratian summassa olevista tiedoista, älä unohda vielä pienempää murto-osaa, joka on palvelimella.

"Jossain noin 20 prosenttia valtion tiedoista on saatavissa verkkoon", sanoi Jim Jacobs, liittovaltion hallituksen tietokirjasto Stanfordin yliopiston kirjastossa. "Se on melko suuri palaa tavaroita, joita ei ole saatavana. Vaikka virastoilla on omat wikit ja sisällönhallintajärjestelmät, ainoa kerta, kun tutustu joihinkin niistä, on jos joku FOIA käyttää sitä."

On varma, että paljon tietoa todellakin kaapattiin, ja se sijaitsee nyt ei-julkisilla palvelimilla. Data Refuge -tapahtumien ja projektien, kuten vuoden 2016 lopun indeksoinnin, välillä arkistoitiin yli 200 kt hallitusten verkkosivustoja ja tietoja. Mutta pelastustoiminnan järjestäjät alkoivat ymmärtää, että osittaisia ​​ponnisteluja tehdä kokonaisia ​​kopioita valtion tavaroiden teratavuista kopioita ei voida realistisesti ylläpitää pitkällä aikavälillä - se olisi kuin Titanicin purkaminen sormuksella.

Joten vaikka Data Rescue Denton päätyi yhdeksi laatuaan pidetyistä järjestäytyneistä tapahtumista, yhteinen pyrkimys on kannustanut laajempaa yhteisöä työskentelemään yhdessä pyrkien tekemään hallitustiedoista entistä paremmin löydettäviä, ymmärrettäviä ja käyttökelpoisia, Jacobs kirjoitti blogiviestissä.

Katse kirjastoihin

Pennsylvanian yliopistossa Bethany Wiggin on ympäristöhumanististen Penn-ohjelman johtaja, jossa hän on ollut keskeisessä asemassa Data Refuge -liikkeessä, joka on Data Rescue -tapahtumien perustaja. Hänen mukaansa painopiste on nyt siirtynyt kohti kansallisten puitteiden hyödyntämistä pitkäaikaisiin pyrkimyksiin paikallisesti jaksottaisten jaksojen sijaan.

"Tajusimme taitoja, jotka olivat syntymässä eri paikoissa tekemällä pelastustietojen tapahtumia jotain, jota voitaisiin skaalata", Wiggin sanoi, etenkin tutkimuskirjastoissa. "Mutta nämä pyrkimykset kaikki tapahtuivat ennen kuin aloitimme. Data Refugen voimana on ollut tiivistää noita yhteyksiä; katalysoida pitkäaikaisia, hitaasti liikkuvia projekteja ja loistaa valoa kuinka tärkeitä ne ovat."

Wiggin on viime aikoina auttanut johtamaan Libraries + Network -verkostoa, nousevaa tutkimuskirjastojen, kirjasto-organisaatioiden ja avoimen dataryhmän kumppanuutta, joka on katalysoinut laajentaa kirjastojen perinteistä roolia tietojen saatavuuden säilyttämisessä. Osallistujia ovat Stanfordin yliopiston tutkimuskirjasto, Kalifornian digitaalinen kirjasto ja Mozilla-säätiö, ja niiden panosta ja yhteistyötä tekevät niin laajat yhteisöt kuin kansallisarkisto ja useiden liittovaltion toimistojen päävastaavat.

Yksi projekti on esimerkiksi LOCKSS ("paljon kopioita pitää asiat turvassa"), jota Jacobs on koordinoinut useita vuosia. Se perustuu samaan periaatteeseen kuin 200-vuotias kirjastoverkko, joka tunnetaan nimellä Federal Depository Library Program; nämä kirjastot ovat Yhdysvaltojen hallituksen painotalon (GPO) julkaisujen virallisia arkistoja.

LOCKSS on sitä vastoin tämän järjestelmän yksityinen digitaaliversio, joka on toistaiseksi käsitellyt 36 kirjastoa, jotka keräävät julkaisuja GPO: lta sen yhteistyön avulla. Se on malli, jolla digitaalista tietoa voidaan suojata poistolta tai luvattomalta käytöllä laajalti fyysisesti.

"Et voi taata säilyttämistä, ellei sinulla ole hallintaa sisällöstä", Jacobs sanoi. "Osa siitä, mikä teki säilytyskirjastoista tärkeitä ja hyödyllisiä viimeisen 200 vuoden aikana, oli se, että kukaan hallituksessa ei pystynyt muokkaamaan asiakirjaa menemättä tosiasiallisesti 1500 kirjastoon ja sanomalla" Joo, vaihda tämä yksi sivu täällä "."

LOCKSS-ohjelmisto käyttää sisällön välimuistien tarkistusta bittitasolla ja vertaa sitä muiden kirjastojen hallussa olevaan sisältöön, mikä Jacobsin mukaan auttaa varmistamaan pitkäaikaisen säilymisen korjaamalla pilaantuneet tiedostot.

John Chodacki, toinen yhteistyökumppani Libraries + -verkoston kanssa, johtaa Kalifornian digitaalisen kirjaston, virtuaalisen tietopalvelun, joka palvelee Kalifornian yliopiston järjestelmän kaikkia 10 kampusta, kuraation kuraattoria. Yhteistyössä Code for Science and Society -kehittäjän Max Ogdenin ja data.govin pääarkkitehdin Philip Ashlockin kanssa Chodacki sanoo, että heidän keskittymisensä on ollut data.govin käyttämiseen kaksisuuntaisena kaduna.

He osoittivat ensin, että tietojen pelastaminen itsessään voisi olla paljon tehokkaampaa etsimällä itse data.gov -kopio ja sijoittamalla se ulkopuoliselle sivustolle, datamirror.org, seurantaskripteillä, jotka tarkistavat päivitykset. Sitten Chodacki ja yhteistyökumppanit alkoivat myös tutkia, voisiko peiliin toimitetut tietojoukot ja metatiedot sisällyttää virastojen olemassa oleviin data.gov-työnkulkuihin peilin tynkäsivujen kautta.

Vuoden 2013 Obaman toimeenpanomääräyksen mukaan, joka valtuutti koneellisesti luettavien tietojen julkaisemiseen data.gov-virastossa, virastot olisivat edelleen vastuussa kyseisessä portaalissa lueteltujen tietueiden tuottamisesta; Chodackin ja Ogdenin idea on, että ehdotettujen tietojoukkojen joukkotoiminta yksinkertaisesti auttaa jakamaan työtaakkaa.

"Meidän ei tarvitse toistaa koko ekosysteemiä", Chodacki sanoi. "Liittovaltion hallitus ja nämä virastot ovat käsitelleet tietoja huomattavasti pidempään kuin on ollut hienoa puhua isoista tiedoista paljon vankeammalla tavalla kuin kukaan muu."

Julkisen ja yksityisen sektorin kumppanuudet

Kustannuskysymys on itsestään selvä, kun kyse on siitä, kuinka virastot kykenevät tunnistamaan, mitkä aineistot ovat yleisön kannalta arvokkaimpia, ja julkaisemaan sitten linkit metatietoihinsa tai todellisiin tietoaineistoihinsa hallitusportaalin kautta. Kongressin budjettiviraston (CBO) raportti senaatissa parhaillaan olevasta OPEN Government Data Act -lakiista, joka kodifioisi Obaman toimeenpanovaltion määräyksen lakiin, arvioi, että sen täysimääräinen täytäntöönpano maksaisi 2 miljoonaa dollaria vuosien 2018 ja 2021 välillä.

Julkishallinnon rahamääräisesti se ei tarkoita käytännössä mitään todellista menojen nousua, CBO totesi.

Tehokkuus on kuitenkin toinen kysymys, jota Ed Kearns kokeilee kansallisessa valtameri- ja ilmakehän hallinnossa yhdessä yksityisten kumppaneiden kanssa, kuten Amazon Web Services ja Google. NOAA: n päävastaava Kearns sanoi, että NOAA-tietojen julkisen saatavuuden ja käytön lisääminen on Big Data -projektin päätavoite.

Yritykset tunnistavat haluamansa tietojoukot, ja NOAA välittää sen ilman lisäkustannuksia yleisölle. Mitä tahansa NOAA: lla on, on pöydällä, Kearns sanoi, mutta viiden vuoden kumppanuuden tavoitteena ei ole saada kaikkea NOAA-tietoa pilviltä - vain strategisia paloja.

Tällaisten tietoaineistojen ylläpitäminen yksityisten yritysten pilvipalveluissa tarjoaa useita etuja 80-luvun tyyliselle FTP-käytölle, joka on edelleen standardi suurten aineistojen siirtämiselle liittovaltion virastoilta. Aluksi NOAA: n tietoaineistoilla on taipumus olla laaja - virasto seuraa maan valtameriä, ilmakehää, aurinkoa ja avaruussäätä - ja vaatii joskus viikkoja tai kuukausia julkiseen toimitukseen.

Yksi esimerkki on viraston korkearesurssinen NEXRAD Level II Doppler -tutkistoarkisto. American Meteorological Society -yrityksen toukokuussa julkaiseman tutkimuksen mukaan koko 270 teratavun NEXRAD-arkiston siirtäminen yhdelle asiakkaalle lokakuussa 2015 olisi kestänyt 540 päivää hintaan 203 310 dollaria. Koko kopiota arkistosta ei ollut koskaan ollut saatavana ulkoista analysointia varten, ennen kuin NOAA työskenteli Amazonin ja Google: n kanssa pilveen.

Kokeilulla on myös ollut mielenkiintoisia varhaisia ​​tuloksia käytön lisääntyessä. NOAA: n sää- ja ennusteverkkosivut saavat jo jonkin verran korkeinta liikennettä hallitusten sivustojen keskuudessa, mutta sen jälkeen kun Google on äskettäin integroinut yhden ilmaston ja säätietoaineiston, joka on kooltaan kokoinen, BigQuery-tietokantaansa, yritys ilmoitti toimittavansa 1, 2 petatavua tätä tietojoukkoa. tammikuun 1. päivästä 30. huhtikuuta - paljon enemmän kuin koskaan oli saanut aikaan samanlaisessa aikataulussa NOAA-palvelimilta.

"Google pystyi avaamaan sen kokonaan uudelle yleisölle", Kearns sanoi.

Se ei ole vain sadetta ja vuodenaikojen lämpötiloja. Tietokannat, jotka ovat nyt saatavana Big Data -kumppaneiden kautta, sisältävät kalastustiedot, meren säätiedot ja IBM: n ylläpitämän luettelon, jossa luetellaan ajankohtaiset, ennuste-, historialliset ja geospatiaaliset tietoaineistot NOAA-keskuksista. Tulevat tietoaineistot voisivat sisältää jopa tietoja ekosysteemeistä ja kalastuksen genomista.

Mutta suunnittelulla kumppanuuden avulla yhteistyökumppanit voivat valita haluamansa kirsikka-arkin, mikä on vaara, että hämärtyvät, mutta mahdollisesti arvokkaat aineistot eivät näe paljon päivänvaloa. Kearnsin mukaan on liian aikaista sanoa, mitä lopulta voidaan pitää arvokkaana.

"Minkä laajuuden ja laajuuden, mitä näillä tiedoilla voidaan tehdä, on meille uskomaton", hän lisäsi. "Emme voi kuvitella kaikkia mahdollisia käyttötapoja."

Pienemmässä mittakaavassa Philadelphian kaupunki on myös työskennellyt yksityisen tahon kanssa julkistaakseen tietokokonaisuuksia, jotka yleisö on sanonut olevansa hyödyllisimpiä. Vaikka kaupungin koko antaa sille enemmän päivittäistä operatiivista ohjattavuutta kuin liittovaltion yksikkö, Phillyn malli edustaa yhtä lähestymistapaa vielä julkaisematta olevien tietojoukkojen julkaisujen strategisessa suunnittelussa.

Tietojen visualisointiin erikoistunut Philly-pohjainen ohjelmistoyritys Azavea kehitti yhteistyössä kaupungin tietotekniikan päällikön Tim Wisniewskin kanssa luettelon julkaisematta olevista aineistoista, joita kaupungin voittoa tavoittelemattomilla organisaatioilla voi olla kiinnostusta käyttää. Wisniewski ja Azavea käyttivät luettelon laatimiseen sekä kaupungin online-metatietoluetteloa että kaupunkien osastojen panosta. Azavea ja muut yhteistyökumppanit ostivat sen jälkeen luettelon Philadelphian voittoa tavoittelemattomille järjestöille ja julkaisivat OpenDataVote-kilpailun, joka yleisölle äänesti näiden voittoa tavoittelemattomien organisaatioiden esittämistä hankkeista siitä, kuinka he käyttäisivät haluamiaan tietojoukkoja.

Äskettäin voittaja oli voittoa tavoittelemattoman MicroSociettin esittämä ehdotus käyttää Philadelphian koulupiirin lahjoittajia koskevia kaupunkitietoja mittaamaan voittoa tavoittelemattomien ohjelmien vaikutusta kouluissa.

"Voimme sanoa, että tämä kaupungin voittoa tavoittelematon organisaatio on kiinnostunut tietystä aineistosta, koska he voivat tehdä jotain sen kanssa, ja että nämä monet ihmiset äänestivät tukemaan niitä", Wisniewski sanoi. "Sen avulla voimme mennä osastoille vankalla käytöllä, sen sijaan että sanomme: hei, vapauta nämä tiedot vain siksi."

Vanha data ja uusi

Mutta mitä tapahtuu silloinkin, kun siellä on runsaasti pääsyä jo olemassa oleviin tietoihin, kun uudet politiikat ja rahoitusdirektiivit tarkoittavat, että itse tietoja ei vain luoda enää? Se on todellinen huolenaihe, sanoi Ann Dunkin, joka toimi presidentti Obaman johdolla ympäristönsuojeluviraston tiedottajana ja johtaa nyt Kalifornian Santa Claran piirikunnan tietotekniikkaa.

"Ihmiset ovat huolissaan vanhoista tiedoista, mutta minua huolestuttaa eniten se, että uutta tietoa ei ole saatavana yhtä nopeasti kuin aiemmin tai sitä ei luoda ollenkaan", Dunkin sanoi.

Yhdessä Science- lehden vuonna 2018 ehdottamassa federaatiobudjettianalyysissä monet valtion virastot havaitsisivat huomattavia vähennyksiä tutkimusbudjetteihinsa, jos budjetti hyväksytään ehdotetun mukaisesti. Noin 22 prosentin leikkaus kansallisissa terveysinstituuteissa lisäisi maksuja tutkimusyliopistoille. NASA: n budjettipyyntö eliminoisi kasvihuonekaasupäästöjen ja muiden maatiedeohjelmien seurantaa koskevat aloitteet. NOAA: n ilmasto-ohjelmat voitaisiin myös sulkea samanlaisilla leikkauksilla.

Toimikautensa aikana EPA oli pyrkinyt tekemään tiedonkeruustaan ​​työkalun, jota kuka tahansa voi käyttää ympäristön terveyden ymmärtämiseen ja siihen reagoimiseen. Huono ilmapäivä? Älä mene ulos. Hidastaa saastuntaa? Pidä lapset poissa.

"Odotukseni on, että se siirtyy taaksepäin", Dunkin lisäsi. "Voisin olla väärässä, mutta jos sanot, ettemme aio antaa tietoja saataville, looginen johtopäätös on tietojoukot, jotka voivat auttaa yleisön jäseniä. Myöskään niitä ei ole saatavilla tai niitä ei luoda ensisijaisesti."

Data Refugen Wiggin työskentelee tähän aiheeseen liittyvän tarinankerrontaprojektin kanssa, jonka hän toivoo katalysoivan enemmän ihmisiä vaatimaan jatkuvia tietojen julkaisemista ja luomaan perustan tuelle olemassa olevien tiedonkeruuohjelmien jatkamiselle koko liittohallituksessa. "Kolme tarinaa kaupunkissamme" -jutut kuvaavat usein liittovaltion tietojen piilotettuja vaikutuksia odottamattomissa paikoissa, alkaen ensin Philadelphiasta, sitten muista paikoista koko maassa.

"Tärkeä osa Data Refuge -liikettä siirtyessämme seuraavaan vaiheeseen auttaa ihmisiä ymmärtämään, kuinka laajalti käytettyä liittovaltion tuottamia tietoja on heidän elämässään", Wiggin sanoi. "Siirrätkö sitä ilmastolle, terveydelle tai yleiseen turvallisuuteen, se on edelleen liittovaltion tietoja. Se on yhteisöissä, kaupungintalossa, poliisitoimissa ja armeijassa. Meidän on muistettava, kuinka tärkeitä nämä tiedot ovat."

resurssit:

  • EPA Environmental Dataset Gateway: Ympäristönsuojeluviraston metatietoportaali.
  • Open Data @ DOE: Energiaministeriön avoin tietoportaali.
  • USDA -tutkimuspalvelun tietoportaali
  • NOAA Big Data Resurssit: Linkit Big Data -kumppaneiden alustussivuille, jotka ylläpitävät NOAA: n tuottamaa tietoa.
  • Pohjois-Teksasin yliopisto: Kyberhautausmaa: Arkisto vanhentuneista, vanhentuneista tai suljettujen hallituksen verkkosivustoista.
  • Ympäristötiedot ja hallinto -aloite Arkistointi-projektisivu: Työkalut, koodi ja sovellukset, jotka liittyvät hallitustietojen löytämiseen ja arkistointiin.
  • Internet-arkiston peruutuskone
  • Internet-arkisto: Kuinka säästää sivuja retrospektiivikoneessa: Kuusi tapaa nimetä sivut arkistointia varten.
  • Kalifornian digitaalikirjasto: Term Term End -katsaus: Kokoelma Yhdysvaltain hallituksen verkkosivustoja, jotka on tallennettu loppuosan indeksoinnista vuodesta 2008 tähän päivään.
  • FreeGovInfo.info: Laaja-alainen sisältö, joka sisältää tietoja osavaltioiden ja liittovaltion tietoportaaleista sekä avoimiin tietoon liittyviä uutisia sisältäviä uutisarkistoja.
  • Climate Mirror: Kokoelma vapaaehtoisten keräämiä ilmastotietoja.

Tämä tarina ilmestyi ensimmäisen kerran PC Magazine Digital Edition -lehdessä. Tilaa jo tänään enemmän alkuperäisiä ominaisuustarinoita, uutisia, arvosteluja ja miten!

Nämä kannattajat haluavat varmistaa, että tietomme eivät katoa