Quantcast
Channel: Techtudo
Viewing all articles
Browse latest Browse all 19109

Internet e WWW

$
0
0

Tim Berners-Lee, ou melhor, com todo o respeito que ele bem merece, Sir Timothy John Berners-Lee, já que em 2009 foi sagrado Cavaleiro pela Rainha da Inglaterra, graduou-se em física pela Universidade de Oxford em 1976. Em 1980 trabalhou na CERN durante alguns meses como empregado de uma empresa contratada. Quatro anos depois voltou à organização como membro da equipe de pesquisadores.

Embora o envolvimento da CERN com o desenvolvimento da Internet seja tão forte que leva muita gente a pensar que os objetivos da CERN têm algo a ver com informática e telecomunicações, ela é na verdade a Organização Europeia para Pesquisas Nucleares. O termo pelo qual é conhecida, CERN, é a sigla do nome original em francês (sua sede é em Genebra, Suíça) a ela atribuído por ocasião de sua fundação em 1952: “Conseil Européen pour la Recherche Nucléaire”. A CERN é então uma organização internacional cujo objetivo é operar o maior laboratório de partículas do mundo. Maior mesmo: seu colisor de partículas, o Hadron, se estende por uma circunferência de 27 km de comprimento enterrada a uma profundidade que varia entre 100 m e 175 m abaixo da superfície do terreno, atravessando as fronteiras da Suíça, penetrando na França e retornado à Suíça. Sua mais recente façanha, em 2012, que recebeu grande destaque na imprensa e despertou notável interesse na população em geral (embora nem uma nem outra fizessem a menor ideia do que realmente se tratava) foi a descoberta do famoso, mui falado mas pouco encontradiço Bóson de Higgs, elusiva partícula atômica apelidada de “partícula de deus”.

Seu envolvimento com os computadores deve-se ao fato de que é absolutamente impossível operar o colisor de partículas e desenvolver qualquer pesquisa séria sobre partículas atômicas sem o concurso de poderosos computadores e uma equipe de altíssimo nível para operá-los. Berners-Lee fazia parte desta equipe de elite. E o fato da WWW ter lá sido concebida é resultado da CERN ser o maior e mais importante nó da Internet na Europa. Afinal, a demanda de consultas a trabalhos científicos atualizados e de alto nível por aquelas bandas não é nada desprezível.

Pois foi justamente isto que incomodou Berners-Lee quando lá trabalhava. Os documentos que precisava consultar estavam na Internet, mas espalhados em servidores de diferentes instituições acadêmicas. As ferramentas como Archie, Veronica e Gopher, ajudavam muito mas não resolviam. O que ele precisava era um sistema baseado em referências cruzadas que o levasse de um documento a outro sem demora e com pouco trabalho.

Foi então que se lembrou do MEMEX.

MEMEX é um acrônimo formado pela junção de trechos de duas palavras, “MEMory” e “indEX”. O conceito foi moldado por Vannevar Bush em 1945, muitos anos antes da existência da Internet e quando praticamente não havia computadores.

Bush foi um gênio nascido em 1890 nos EUA e falecido em 1974, quando a ARPANet dava os primeiros passos e contava com menos de 50 IMPs (Interface Message Processors, o nome que se dava então às máquinas que funcionavam como roteadores formando os nós da rede).

Os trabalhos de Bush se estenderam por diversas áreas e suas maiores contribuições à ciência e tecnologia ocorreram durante o período da Segunda Grande Guerra, quando dirigiu o OSRD “Office for Scientific Research and Development”, ou escritório de pesquisas e desenvolvimento científico) onde foram desenvolvidas as mais importantes pesquisas militares. Envolveu-se diretamente em diversos projetos, inclusive em um computador analógico. Mas, no que toca ao assunto desta coluna, sua grande realização foi criar o conceito do MEMEX.

A ideia foi concebida ainda em 1930 quando Bush imaginou uma forma de “ampliar” a memória através de um dispositivo baseado em microfilmes onde “an individual stores all his books, records, and communications, and which is mechanized so that it may be consulted with exceeding speed and flexibility. It is an enlarged intimate supplement to his memory” (uma pessoa pudesse armazenar todos os seus livros, registros, e comunicações, e que fosse mecanizado de tal maneira que pudesse ser consultado com enorme rapidez e flexibilidade. Ele [o dispositivo] seria um suplemento íntimo ampliado se sua memória).

Esta frase, hoje em dia, poderia perfeitamente descrever os modernos telefones espertos e tabletes, naturalmente. Mas a ideia de Bush não era esta, como já veremos.

GPC20130606_1Figura 1: Concepção do MEMEX (Foto: Reprodução)

Nos quinze anos seguintes Bush elaborou o conceito e projetou um dispositivo eletromecânico que foi descrito detalhadamente no artigo histórico publicado no “The Atlantic Monthly” com o título “As We May Think” (este atalho leva à descrição comentada do artigo na Wikipedia e a Figura 1, obtida no sítio francês Hiseo, mostra uma concepção do MEMEX).

O artigo é conceitual e descreve o MEMEX e seus fundamentos teóricos. Jamais a máquina foi montada. Não obstante o artigo de Bush exerceu tamanha influência nas demais ciências e tecnologias que passou a ser conhecido por uma sigla, as iniciais de seu título: “AWMT” (faça uma pesquisa no Google e receberá pelo menos um resultado referente ao artigo).

Simplificadamente, o MEMEX seria um dispositivo eletromecânico que permitiria a seus usuários criar, organizar e consultar uma enorme biblioteca cujo conteúdo poderia ser variadíssimo, indo de obras literárias famosas até anotações pessoais. Os itens seriam gravados em microfilmes (uma classe de microformulários muito comuns no século passado para armazenar grandes volumes de informação). O dispositivo propriamente dito seria um senhor trambolho (veja figura): uma máquina maior que uma escrivaninha comum na qual seria instalada uma combinação de controles eletromecânicos, câmaras e leitores de microfilmes e mais o que fosse necessário para permitir uma consulta imediata. Mas, do ponto de vista desta coluna, o que efetivamente nos interessa é a forma como um documento remetia a um segundo documento correlato e assim por diante, através de indexação de palavras chave.

Em resumo: o MEMEX se constituiu na primeira referência ao que hoje chamamos “hipertexto”, a mola mestra que impulsiona toda a chamada WWW (World Wide Web). E isto, convém lembrar, em um artigo publicado em 1945.

Antes, porém, de seguir adiante convém firmar um conceito. Isto porque a maioria das pessoas – inclusive eu, em conversas informais – usa o termo “Internet” e a sigla “WWW” (ou sua expressão “World Wide Web”, teia, ou rede, de alcance mundial, ou ainda simplesmente “web”) como se fossem a mesma coisa. E, para todos os efeitos práticos, estão (quase) certos. Não obstante, há algumas diferenças. Diferenças que são importantes para que venhamos a entender em toda a sua amplitude a façanha de Tim Berners-Lee.

Começando pela Internet: ela é a sucessora da ARPANet sobre a qual falamos na coluna passada, uma rede estruturada como uma teia, formada por um imenso número de nós (servidores), cada um deles interligado a diversos outros, por onde trafegam dados encapsulados em “pacotes” (“packet switching”).

Que dados? Bem, pela Internet moderna transita praticamente de tudo.

Para poder trabalhar com tamanha diversidade de dados e saber como lidar com eles, são estabelecidas determinadas regras que informam não somente o que o pacote de dados contém, como ainda métodos de determinar se houve erro na transmissão, meios de corrigi-los e coisa e tal. Este conjunto de regras chama-se “protocolo”. Tudo isto é controlado por um protocolo geral que controla o tráfego na rede, o TCP, ou “Transmission Control Protocol”.

Por exemplo: quando se trata de uma simples transferência de arquivos, as regras a serem obedecidas estão definidas no FTP (“File Transfer Protocol”, ou protocolo de transferência de arquivos). Cada pacote de dados é gerado de acordo com estas regras, rotulado como parte de um arquivo e contendo o endereço da máquina destinatária. E a partir deste momento vai seguindo de nó em nó até chegar ao destino.

Já se o objeto a ser transferido for uma mensagem de correio eletrônico, podem ser usados diferentes tipos de protocolo, como o POP3 (“Post Office Protocol 3” ou protocolo de correios) ou IMAP (“Internet Message Access Protocol” ou protocolo de acesso a mensagens na Internet).

Em suma: cada uma das atividades que podem ser exercidas na Internet tem que obedecer estritamente às regras do protocolo correspondente. E os protocolos são interpretados pelos programas que são usados para controlar a atividade, como o programa de correio eletrônico (Outlook, Thunderbird, Opera ou seja lá qual for o seu).

Uma destas atividade é justamente esta que você, meu preclaro leitor ou leitora, está exercendo justamente agora: consultar “páginas” armazenadas em “sítios” da Internet e exibidas por um programa navegador como o Chrome, Firefox ou IE (em ordem alfabética para evitar controvérsias de ordem religiosa sobre a preferência por um ou por outro).

O conteúdo destas páginas usa um protocolo específico para ser transmitido. Chama-se, já veremos por que, HTTP (“HyperText Transfer Protocol” ou protocolo de transferência de hipertexto).

Pois bem: enquanto a Internet é a rede por onde “passa” tudo (naturalmente controlado pelo devido protocolo), a WWW é apenas aquela parte da Internet cuja transferência de dados é regulada e controlada pelo HTTP.

Por exemplo: quando você navega em um sítio saltando de uma página para outra do mesmo ou de outro sítio clicando nos atalhos (” links”) correspondentes, você está usando a WWW. Mas quando você usa o Outlook para ler e responder suas mensagens, está apenas usando a Internet. É simples assim

Ou quase. Pois se você gerencia suas mensagens de correio eletrônico usando um programa tipo “webmail” que roda “dentro” de seu programa navegador, como o Google Mail, está usando a WWW (e não a Internet) para gerenciar mensagens de correio eletrônico. Isto porque as mensagens armazenadas no servidor do Google são “montadas” em uma página que é enviada a seu programa navegador usando o protocolo HTTP.

Se você entendeu o parágrafo acima, ótimo. Percebeu bem a diferença entre WWW e Internet. Se não entendeu, não se preocupe. Basta saber que a Internet é uma rede imensa, que cobre todo o planeta, por onde trafegam diferentes espécies de dados encapsulados em pacotes, cada um deles obedecendo a um determinado protocolo para sua transferência. Já a WWW é aquela parte da Internet cujos dados são transferidos usando o protocolo HTTP. E temos conversado.

Agora, para fechar tudo isto e, efetivamente, entender o feito hercúleo de Berners-Lee, só falta destrinchar o conceito de “hipertexto”.

Nosso assunto da próxima semana.

B. Piropo


Viewing all articles
Browse latest Browse all 19109


<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>