4 June 2012

Mashups: O Que São? Desafios Técnicos E Sociais - Parte 2

Mashups estão cheias de desafios técnicos e é por isso que muitos adeptos da tecnologia são atraídos por elas. O desafio de ter que encontrar soluções novas para problemas "antigos" enquanto se "inventam" novas formas de misturar e combinar recursos e ferramentas existentes é sem dúvida um grande motivador para qualquer programador.

Mashup da imagem por Robin e Nico Good - créditos das imagens originais - gira-discos / Dolphin Music - piza / Palatino join-us

Na segunda parte (Parte 1) deste guia, as Mashups por Duane Merrill, a atenção vira-se para os "Desafios Técnicos" e "Aspectos Sociais" deste campo rapidamente evolutivo.

Os desafios tecnológicos normais e os entraves óbvios são examinados e explicados de uma forma introdutória mas tecnicamente competente. Há que ainda ter em atenção as boas considerações referentes à acessibilidade, SEO, segurança e outros problemas que frequentemente são ignorados durante a fase inicial de planeamento de qualquer projecto.

Os aspectos sociais não são menos importantes na criação de mashups on-line e em particular a concessão entre a protecção da propriedade intelectual e a privacidade do consumidor versus o uso justo sendo notável a livre circulação de informação.

Como sempre muitos links ajudam-no a saber mais sobre possíveis termos e tecnologias com as quais pode ainda não estar familiarizado.

Eis os detalhes:

Intro por Robin Good

Crédito da imagem: Sun - A Grande Mashup

Mashups: A Nova Espécie de Aplicação Web

Desafios Técnicos

Blogue de Vincent Thomé

Como qualquer outro domínio de integração de dados, o desenvolvimento de mashups está repleto de desafios técnicos que devem ser abordados, especialmente porque as aplicações de mashup se tornam mais ricas em opções - e em funcionalidades.

Esta secção aborda uma série desses desafios, alguns dos quais pode abordar e mitigar, enquanto que outros ainda estão em aberto.

Desafios da Integração de Dados: Significado Semântico e Qualidade dos Dados

Estudos qualitativos sugerem que a principal preocupação das empresas de TI é a integração de dados dentro da organização virtual da empresa. (Neste contexto, utilizo o termo "organização virtual" para me referir a uma composição de unidades empresariais federadas, cada uma contida no seu próprio domínio administrativo.)

Como muitos gestores de empresas de TI se deparam com a tarefa de integração de fontes de dados antigos (por exemplo, para criar monitores empresariais que reflectem condições actuais de negócio), os criadores de mashups são confrontados com os desafios análogos de derivar sentido semântico entre conjuntos de dados heterogéneos. Logo, para ter uma ideia do que os criadores de mashups reservam, não tem de ir mais longe, basta ver os desafios de integração de dados reportados por empresas de TI.

Por exemplo, sistemas de tradução entre modelos de dados, têm que ser concebidos.

Quando converte dados em formulários comuns, e quando o mapeamento não está completo (por exemplo, uma fonte de dados poderá ter um modelo onde um tipo de endereço contém um campo de país, ao passo que outra não o tem), é por vezes necessário proceder a algumas suposições razoáveis. Já desafiante, isto é agravado pelo facto dos criadores de mashups poderem não ser peritos nos modelos de fonte de dados, uma vez que os modelos lhes são alheios e porque estas suposições razoáveis poderão não ser intuitivas ou claras.

Para além dos dados em falta ou mapeamentos incompletos, o criador de mashups poderá descobrir que os dados que pretende integrar não são adequados para automatização por máquinas; necessita de limpeza.

Por exemplo, os registos de apreensões policiais podem ser inseridos inconsistentemente, utilizando abreviaturas comuns para nomes (como "mkt sqr" num registo e "Market Square" noutro), tornando o reconhecimento automatizado igualmente difícil, mesmo com uma boa heurística.

Modelos de tecnologia semântica, como RDF, pode ajudar a diminuir o problema de reconhecimento automatizado entre diferentes tipos de conjuntos de dados, logo que esteja incluído na base de dados.

Fontes de dados antigas irão provavelmente exigir muito esforço humano em termos de análises de filtragem de dados antes que possam ser avaliadas para tecnologias de modelação semântica.

Os criadores de mashups podem, também ser confrontados com vários problemas que os gestores de integração de TI não enfrentam, sendo um deles a poluição de dados.

Como parte do seu design de aplicações, muitas mashups solicitam input de utilizadores públicos. Como evidenciado no domínio das aplicações wiki, esta é uma faca de dois gumes pois:

a) pode ser muito poderosa porque permite a contribuição aberta e evolução dos melhores dados,

b) no entanto pode estar sujeita à entrada de dados inconsistentes, incorrectos, ou intencionalmente enganosos. Este último pode criar dúvidas em relação à fiabilidade dos dados, o que pode por em causa o valor oferecido pela mashup.

Outro conjunto de problemas de integração que os criadores de mashups enfrentam, surge quando técnicas de leitura de ecrã têm que ser utilizadas para aquisição de dados.

Como já foi discutido na secção anterior, combinar ferramentas de leitura e aquisição e modelos de dados requer um grande esforço de engenharia reversa. Mesmo no melhor dos casos, onde estas ferramentas e modelos podem ser criados, o necessário é uma re-concepção de como o sítio Web original apresenta o seu conteúdo (ou esquecimento e abandono) para quebrar o processo de integração e causar a falha da aplicação mashup.

Os Desafios dos Componentes

O modelo Ajax de desenvolvimento Web pode oferecer uma experiência muito mais imediata e mais rica do que o refrescamento tradicional das páginas mas apresenta também algumas dificuldades.

No seu básico, o Ajax utiliza as capacidades de scripting do browser do cliente em conjunto com o seu DOM para conseguir um método de entrega de conteúdos que não foi inteiramente considerada pelos criadores do browser. (Talvez esta natureza tipo hack contribui para o interesse do Ajax.) No entanto, isto sujeita as aplicações Ajax aos mesmos problemas de compatibilidade que assolaram os Web designers desde que a Microsoft criou o Internet Explorer.

Por exemplo, os motores Ajax utilizam um objecto XMLHttpRequest para trocar dados assincronamente com servidores remotos. No Internet Explorer 6, este objecto é implementado com ActiveX em vez de JavaScript nativo, que exige que o ActiveX esteja activado.

Um requisito fundamental é que o Ajax exige que o JavaScript esteja activado no browser do utilizador. Esta poderá ser uma suposição razoável para a maioria da população, mas certamente existem utilizadores que utilizam browsers ou ferramentas automatizadas que ou não suportam JavaScript ou não o têm activo. Os robots, spiders e Web crawlers são um exemplo desse tipo de ferramentas, que agregam informação para os motores de busca da Internet e intranet. Sem uma degradação graciosa, aplicações de mashup em Ajax poderão ser confrontadas com uma base de utilizadores mínima ou com uma pequena visibilidade nos motores de busca.

A utilização de JavaScript para actualizar assíncronamente dados na página pode também criar problemas ao nível da interface de utilizador.

Porque os conteúdos já não estão necessariamente associados ao URL na barra de endereço do browser, os utilizadores poderão nem sempre apreciar as funcionalidades que geralmente esperam quando utilizam o botão de RETROCEDER, ou a funcionalidade de FAVORITOS. E, embora o Ajax possa reduzir a latência ao pedir actualizações incrementais de conteúdos, más concepções podem prejudicar a experiência do utilizador, tal como quando a granularidade da actualização é suficientemente pequena que a quantidade e o tráfego das actualizações saturam os recursos disponíveis.

E tenha também cuidado para suportar o utilizador ( por exemplo, com feedback visual com barras de progresso) enquanto a interface carrega ou o conteúdo é actualizado.

Tal como qualquer aplicação distribuída ou de vários domínios, os criadores de mashups e fornecedores de conteúdos terão também que enfrentar certas preocupações com a segurança.

A noção de identidade pode ser um tema complicado, pois a Web tradicional foi primariamente concebida para acesso anónimo.

Autenticação única é uma funcionalidade desejável, mas existem várias tecnologias concorrentes (desde o Microsoft Passport à Liberty Alliance), criando assim uma identidade de espaços de nomes fragmentados que também tem que integrar.

Os fornecedores de conteúdos irão certamente empregar esquemas de autenticação e autorização (o que exige a noção de identidade segura ou atributos de segurança identificável) nas suas APIs para aplicar modelos de negócio que envolvam subscrições pagas ou dados importantes.

Dados importantes provavelmente irão exigir confidencialidade (isto é, encriptação), e tem que ter cuidado quando o reúne com outras fontes para que não sejam colocados em risco.

A identidade também será crucial em termos de obediência regulamentar e organizativa. Além disso, com a integração de dados a dar-se ao nível do servidor e do cliente, a delegação de identidade e credenciais do utilizador para o serviço de mashup poderá ser um requisito.

Desafios Sociais

Para além dos desafios técnicos descritos na secção anterior, os problemas sociais surgem (ou irão surgir) à medida que os mashups se tornam mais populares.

Um dos maiores problemas sociais que os criadores de mashups enfrentam é a concessão entre a protecção da propriedade intelectual e a privacidade do consumidor contra um uso justo e a livre circulação de informação.

Fornecedores de conteúdos menos respeitadores (alvo de leitura de ecrã), e até fornecedores de conteúdos que expõem as APIs para facilitar a recolha de dados podem determinar que o seu conteúdo está a ser utilizado de uma forma que não aprovam.

(Para uma boa análise sobre as regulamentações de agregações Web, consulte a secção de Recursos no fim deste artigo.)

O género de aplicações mashup Web ainda está numa fase inicial, com programadores a criá-las nos seus tempos livres, como um hobbie.

Estes programadores poderão não ser conhecedores (ou preocupados com) problemas como a segurança. Adicionalmente, os fornecedores de conteúdos estão apenas a começar a ver valor na oferta de APIs para acesso automático a conteúdos, e muitos não as consideram um elemento importante nos negócios. Esta combinação pode criar má qualidade de software, pois as prioridades, tais como testes e controlo de qualidade são ultrapassados por rascunhos e inovação.

A comunidade como um todo terá de trabalhar em conjunto para reunir padrões abertos e toolkits reutilizáveis para facilitar processos maduros de desenvolvimento de software.

Antes que as mashups possam fazer a transição de brinquedos engraçados para aplicações sofisticadas, muito terá de ser feito na filtragem de padrões robustos, protocolos, modelos e toolkits.

Para que isto aconteça, os líderes da indústria de desenvolvimento, fornecedores de conteúdos e empresários terão que encontrar valor nos seus mashups, o que significa modelos de negócio viáveis.

Os fornecedores de APIs terão que determinar se irão cobrar pelo seu conteúdo e se o fizerem, como (por exemplo, por subscrição ou por uso). Talvez ofereçam vários níveis de qualidade de serviço.

Alguns fornecedores de mercado como o eBay ou Amazon, poderão descobrir que a utilização livre das suas APIs aumenta o movimento de produtos.

Os criadores de mashups podem procurar um modelo de lucro baseado em anúncios ou talvez criar aplicações mashup interessantes com o propósito de serem adquiridas.

Fim da Parte 2

Parte 1 - Mashups: O Que São? Conheça Os Seus Tipos E Tecnologias De Suporte - Parte 1

Recursos

Saiba

Programmable Web: Mantenha-se a par dos mais recentes mashups e APIs da Web 2.0.

Considering Ajax, Part 1: Cut through the hype(Chris Laffra, developerWorks, May 2006): Considere-os um ponto de discussão para cada programador antes que utilize técnicas Ajax para um sítio Web.

Página Ajax: Visite esta página patrocinada pelo Mozilla Development Center

The Interplay of Web Aggregation and Regulations (LawTech): Assegure-se que lê esta boa análise das regulamentações e agregações Web (ficheiro PDF).

DB2 and open source: Put yourself on the map with Google Maps API, DB2/Informix, and PHP on Linux (Marty Lurie e Aron Y. Lurie, developerWorks, Março 2006): Crie um mapa de simples utilização com os seus dados.

Building Web service applications with the Google API (Nicholas Chase, developerWorks, Maio 2002): Saiba como incluir resultados de pesquisas Google e outras informações nas suas aplicações Java com este tutorial.

The ultimate mashup -- Web services and the semantic Web - série de tutoriais: Siga todos os tutoriais nesta série e crie uma mashup personalizada.

Second Generation Web Services: Leia este artigo da XML.com para cobertura sobre a arquitectura da REST.

REST and the Real World: Leia mais sobre a REST no XML.com.

O sítio Web W3C Semantic Web Activity: Leia sobre a Web Semântica.

W3C RDF Activity: Visite este sítio Web para as notícias mais recentes sobre Resource Description Framework.

W3C RDF Activity: Visite este sítio Web para as notícias mais recentes sobre Resource Description Framework.

Introdução a Jena: Utilize modelos RDF nas suas aplicações Java com a Jena Semantic Web Framework (Philip McCarthy, developerWorks, Junho 2004): Saiba como utilizar o Jena Semantic Web Toolkit para tirar partido dos modelos de dados RDF nas suas aplicações Java.

O que é o RSS: Do XML.com, saiba mais sobre este formato de sindicação para notícias, conteúdos e blogues pessoais.

Atom Overview: Leia sobre o formato de conteúdos Web em XML e sindicação de meta dados e protocolo ao nível de aplicação no AtomEnabled.org

Certificação IBM XML 1.1: Descubra como pode ser um IBM Certified Developer em XML 1.1 e tecnologias relacionadas.

XML: Veja o developerWorks XML Zone para um grande conjunto de artigos técnicos e dicas, tutoriais, padrões e Redbooks da IBM.

Webcasts e eventos técnicos da developerWorks : Esteja a par da tecnologia nestas sessões.

Obtenha produtos e tecnologias

W3C SOAP Specification: Obtenha a versão mais recente.

Scraping com estilo: scrAPI toolkit para Ruby: Teste esta tecnologia para os seus mashups

Debata

Fóruns de discussão XML Zone: Participe em muitos dos fóruns sobre XML.

Sobre o autor

Duane Merrill desenvolveu computação distribuída e plataformas de integração de dados distribuídos por mais de cinco anos. Tem sido um colaborador no Legion Project na Universidade da Virgínia e um programador interino no produto de integração de dados empresariais distribuídos Avaki da Avaki Corporation. Está de momento a obter o seu Ph.D. em Ciências Informáticas na Universidade da Virgínia.

Duane Merrill -
Reference: IBM [ leia mais ]