Noteworthy Information

A tirania das planilhas

Tim Harford discute um notório incidente com o Excel no ano passado, quando o Reino Unido perdeu o controle sobre 16.000 casos de COVID-19 devido ao limite de colunas em arquivo .xls. O autor apresenta uma história das planilhas, datando desde 1396, quando Francesco di Marco Datini inventou o duplo registro de livros. Um texto muito agradável.

[Simple] The Tyranny of Spreadsheets

In discussing the notorious Excel incident last year when the UK lost track of 16,000 Covid cases due to a .xls row limit, Tim Harford presents a history of the spreadsheet, dating all the way back to Francesco di Marco Datini and double-entry bookkeeping in 1396. A delightful piece of writing.

[Intermediate] Building a data team at a mid-stage startup

A story of a new data team leader successfully growing the team and building a data-first culture in a medium-sized technology company: depicting the initial state of the company with data in many different places, frustrated ML researchers who can’t get their research into production, and confusion over what the data team is actually for - some of the experiences you might relate to.

Construindo uma equipe de dados em uma startup de médio porte

A história do novo líder de uma equipe de dados que, com sucesso, expandiu essa equipe e construiu uma cultura de "dados em primeiro lugar" em uma empresa de tecnologia de médio porte. O texto descreve o estado inicial da empresa e sua relação com os dados em diferentes aspectos: pesquisadores de aprendizagem de máquinas frustrados pois não conseguem aplicar sua pesquisa à produção; confusão sobre qual a função exata da equipe de dados - essas são algumas das situações com as quais você pode se identificar

O que eu aprendi sobre dados recentemente

Laurie Voss discute a estrutura das equipes de dados baseado em sua experiência na npm e mais recentemente Netlify. Ele sugere que a Airflow e dbt são os equivalentes no mundo dos dados a frameworks como o Rails: ferramentas opinativas que resolvem problemas centrais, o que significa que agora você pode contratar pessoas que entendem como as pipelines de dados funcionam desde o primeiro dia no emprego.

[Intermediate] What I've learned about data recently

Laurie Voss talks about the structure of data teams, based on his experience at npm and more recently Netlify. He suggests that Airflow and dbt are the data world’s equivalent of frameworks like Rails: opinionated tools that solve core problems and which mean that you can now hire people who understand how your data pipelines work on their first day on the job.


Tools
toyDB

toyDB is a “distributed SQL database in Rust, written as a learning project”, with its own implementations of SQL, raft, ACID transactions, B+trees and more. toyDB author Erik Grinaker has assembled a detailed set of references that he used to learn how to build a database.