Élet az informatika fellegvárában

The Silicon Valley life

The Silicon Valley life

Chris Steipp és a Wikipedia/Wikimedia

2014. február 06. - daneeesh

Múlt hét csütörtökön nálunk járt Chris Steipp a Wikimedia alapítványtól (az egész Wiki univerzum non-profit ugyebár), aki a biztonságtechnikai főnök és egy kis betekintést adott a világ ötödik leglátogatottabb honlapjának működésébe és technikai hátterébe. Mit is jelent a világ ötödik leglátogatottabb oldalának lenni? Óránként több tízmillió látogatót (csak az angol Wikipedia 10 millió látogatót hoz minden órában, míg a magyar kb. 77 ezret), összesen 30,5 millió szócikket, és 800 szervert, amik világszinten működtetik az oldalt. És akkor még nem is beszéltünk a különböző képekről, hangokról, videókról, felhasználókról, és a többiről amiket mind tárolniuk kell és biztosítani, hogy ezek gyorsan hozzáférhetőek legyenek. Vagy az ezekhez kapcsolódó biztonsági kérdésekről, amikről javarészt az előadás szólt.

Mivel az alapítvány fő mozgatórugója a szabad információhoz való hozzáférés biztosítása mindenki számára, így viszonylag kis költségvetésből, kb. évi 40 millió dollárból próbálják kigazdálkodni az oldal fenntartását. Ebből kifolyólag hatalmas hangsúly van az önkénteseken, amit az is mutat, hogy a 160 programozónak, akik aktívan részt vesznek az oldal fejlesztésében, csak a fele teljes munkaidős alkalmazott.chris steipp.jpg

Chris Steipp az előadás közben

Hogy mi következik ebből biztonságtechnikai szempontból?

Chrisnek nagyon sok álmatlan éjszakája volt, amikor elkezdett a Wikimediánál dolgozni, mivel a 'cég' felében vakon meg kellett bíznia, hogy semmilyen kárt nem tesznek a programban, ráadásul néhány önkéntes elég sok hozzáféréssel rendelkezik és szinte bármit megcsinálhat a honlappal. Természetesen itt is közrejátszik a Szilícium-völgy kiváló adottsága és a megannyi informatikai cég közelsége, mivel a kiváltságos önkéntesek közül sokan másik nagy cégeknél dolgoznak (pl. Facebook) vagy korábbi alkalmazottak (by the way, ha minden igaz, a Lyft nagy része például ex-Wikimedia alkalmazott). De ennek ellenére működik ez a rendszer és köszönhetően az önkéntesnek, fenn tudják tartani az oldalt. Ugyanúgy, ahogy a szócikkeket is sokan ellenőrzik, hogy például ne kerüljön be semmilyen új világnap 6 éven keresztül és vegye át sok hírpotál (ugye-ugye? ;) ), úgy a forráskód is állandó felügyelet alatt van.

Mivel a Wikipediának a nap 24 órájában elérhetőnek kell lennie, így három ember felelős az oldal biztonságáért: egy Prágában, egy itt Kaliforniában, és egy Ausztráliában, így nagyjából hárman lefedik a 24 órát, de önkéntesek közül is vannak, akik csak biztonsági problémákkal foglalkoznak. Ilyen például egy ember Virginia államban, aki előszeretetttel talál hibákat, amik csak Internet Explorer 6-al működnek. Valószínűleg könnyebb lenne az élete, ha csak frissítene vagy másik böngészőre váltana, de legalább a hibákhoz azon nyomban csatolja a javítást is.

Egy másik érdekes probléma, ami felüti mostanában a fejét abból adódik, hogy az emberek korábban külön regisztrálhattak mind a 800 aloldalra (például a magyar, az angol, és a német Wikipédiára), most viszont mindenhova ugyanazzal a felhasználónévvel szeretnének bejelentkezni. Hogy mi ezzel a baj? Lehet, hogy a master123 felhasználónevet három különböző ember regisztrálta a magyar, angol, illetve német oldalakon, most viszont mindhárman ezt szeretnék használni a spanyol oldalon. Bejelentkezés szempontjából viszonylag egyszerű a megoldás, mert felhasználónév helyett email cím alapján egyértelműen meghatározható, hogy ki kicsoda, viszont hogy mi alapján döntsék el, hogy ki használja a master123 nevet már egy nehezebb probléma és komplexebb megoldást igényel, de dolgoznak rajta.

Most pedig jöjjön egy kicsit technikaibb rész azoknak, akik eljutottak idáig:

Chris beszélt a technikai részéről is az oldalnak és azt mondta, hogy a Wikipedia azt mutatja meg, hogy hogyan csinálj nagyon sok mindent kis költségvetésből miközben szem előtt tartod a közösség igényeit. Mivel az oldalnak állandóan gyorsan elérhetőnek kell lennie, ezért szinte mindent memcacheben tárolnak redis segítségével és a háttérben frissítik az információkat. A háttér adatbázishoz MariaDB-t használnak és az egész majdnem az egész program PHP-ban lett megírva. A PHP nem túl ideális választás webprojektekhez, ezért ez viszonylag hátrányt jelent a számukra, azonban szerencsére jó kapcsolatot ápolnak a Facebookkal és elkezdtek kísérletezni az ő PHP fordítójukkal, hogy gyorsabb legyen az egész oldal működése. Az eredmények bíztatóak: állítólag amikor először kipróbálták ezt és csak úgy, ahogy volt futatták az oldalukat, csupán egy teszt adott negatív eredményt.

További érdekesség, hogy az oldal loadbalancer-e, vagyis ami elosztja a terhelést a szerverek között, pythonban van megírva és a második vagy a harmadik alkalmazottjuk diplomamunkájának a kiterjesztése, amit a mai napig fejleszt - egy kis motiváció azoknak, akik mostanában fejezik be az egyetemet. Emellett egyedi még egy ilyen kaliberű oldalnál, hogy az oldal forráskódja a szabad információhozzáférés szellemében teljes egészében hozzáférhető, úgyhogy ha valakit jobban érdekel ez a téma, akkor nyugodtan elmerülhet benne és megnézheti, hogy milyen kódot írnak a világ egyik legnagyobb honlapjánál. Ugyaney vonatkozik az összes hibára, beleértve a biztonsági hibákat, amiket már megoldottak, így ezek is szabadon hozzáférhetőek.

Ma este az Addeparon keresztül szerencsém lesz eljutni egy vacsorára Ray Kurzweilal és Steve Jurvetsonnal, ami hatalmas lehetőség és nagyon izgalmasnak ígérkezik, úgyhogy újabb beszámoló várható hamarosan!

A bejegyzés trackback címe:

https://siliconvalleylife.blog.hu/api/trackback/id/tr25799530

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása