Skip to content

Ny twitter

  • CASE - Lage TWITTER API *

Tipper litt på tall: Registrerte brukere: 30 mill brukere. Aktive brukere pr uke: 6 mill brukere. Meldinger pr dag: 60 mill meldinger.

På datalaget: Query-intensivt Scalability Availability

Ikke store krav til latency.

Hovedproblemet er søk. De holder meldingene ganske lenge, og å gjøre fritekstsøk på såpass store datamengder er tungt/umulig i en database. Søkemotor må inn.

Relasjonelle databaser er dårlig egnet.

Laaang diskusjon om design kokte basicly ned til dette: - Vi tror at det er lurt å bruke en graph database. Dennne er godt egnet til å navigere i, kan håndtere store datamengder og funker bra sammen med distribusjon. - Tilbyr greie søkemuligheter. Bør flytte så mye som mulig ut i randsonene for å spare baser og slikt. - Fornuftig å bruke asynkronitet til å spre postingene til etter en publish subscribe modell.