Introdução ao Machine Learning



Aprendizagem de Máquinas: Uma Introdução

Por que a aprendizagem da máquina? Por que você quer entendê-lo? Como isso importa para sua vida? Por que você precisa pelo menos entender o básico sobre isso? A resposta a todas estas perguntas é muito simples: a aprendizagem da máquina a cada dia está se tornando parte de nossa vida. Por isso é importante saber o que é.

O que é isso?

Então, o que é aprendizagem de máquina? Ainda não existe tal definição que todos conheçam, mas existem aplicação para vários setores, por exemplo nós poderíamos aplicar a aprendizagem da máquina para encontrar padrões nos dados. Em seguida, esses padrões são usados para prever o futuro e tomar decisões. Por exemplo, em um Learning Management System (LMS) pode-se identificar que em que capítulo, conteúdo ou imagem um aluno passou mais tempo lendo, então podemos descobrir o que interessa, quais questionários e cursos chamaram mais atenção do aluno, porque e o que. Pode-se aplicar conceitos de aprendizado de máquina para identificar cada ação e o tempo gasto pelo aluno acessando o conteúdo de aprendizagem e, consequentemente, o designer instrucional desse conteúdo saberá qual área do conteúdo as pessoas estão mais interessadas e o que mais precisa ser melhorado.

Outro exemplo poderia ser a detecção de uma fraude bancária na Internet. Se houver uma fraude contínua acontecendo com a transferência de fundos via internet banking e temos os dados completos, poderemos descobrir o padrão envolvido através do qual podemos identificar onde estão as áreas propensas a hackers. Portanto, é tudo sobre padrões e prever os resultados e o futuro com base nesses padrões. Como conclusão para a definição podemos dizer que a aprendizagem da máquina desempenha um papel importante na mineração de dados, processamento de imagem e processamento de linguagem. Não vá fornecer uma análise correta ou um resultado exato baseado na análise, mas fornece um modelo preditivo baseado em dados históricos para tomar decisões. Quanto mais dados, mais as previsões orientadas podem ser feitas.

Padrões

Vamos dar um exemplo simples de leitura e aprendizado. Aprendemos com a leitura, mas como lemos? Lemos através da identificação de padrões; Identificamos as letras, os padrões dos alfabetos para formar palavras. Então nos adaptamos a esse padrão vendo-o repetidas vezes, portanto aprendemos a ler e, finalmente, a ler para aprender. Agora, chegando à fraude bancária, que foi dada como exemplo, suponha que tenhamos dados para as transações acontecidas por meio do banco, podemos criar um modelo de análise preditiva e tentar conhecer o futuro. Vamos supor que temos 5 registros para transações:


Como mostrado na imagem acima, temos os dados do nome do cliente, quantidade e as transações fraudulentas.

Quando vemos os dados e tentamos identificar o padrão, não podemos realmente obter nada, exceto da conclusão de que todos os clientes cujo nome começa com "J" têm transações fraudulentas. Mas isso não é algo sobre o qual podemos confiar, pois isso é uma espécie de previsão vaga. Portanto, a limitação aqui para nós para identificar o padrão correto é dados ou, pode-se dizer, dados limitados / menos. Não podemos concluir porque é provável que as duas transações sejam fraudulentas.

Agora, suponha que temos mais dados como mostrado abaixo:


Assim, temos quase 16 registros de transações conosco agora, com mais detalhes, como a localização da transação e a idade do cliente também. Se olharmos atentamente os dados e tentar encontrar um padrão, vemos que todas as transações fraudulentas foram feitas na China, a faixa etária dos clientes que caem em transações fraudulentas é entre 20 a 25, e o valor para que a fraude é sempre mais de US $ 20000. Então podemos dizer que encontramos um padrão aqui. Mas, novamente, podemos confiar nessa análise e fazer uma previsão? Temos dados suficientes para a análise? Talvez não. Precisamos de mais e mais dados de transações para realmente prever o comportamento baseado em padrões. Mas quando se trata de milhões de registros de transação, seria então impossível para nós encontrar o padrão certo a olho nu ou manualmente. Lá nós precisamos de software para fazer toda a análise, e assim a aprendizagem da máquina entra em cena.

Aprendizado de Máquinas: Visão de Alto Nível

Inicialmente, começamos com muitos dados, os dados que contêm padrões que são identificados dentro da lógica da aprendizagem da máquina e do algoritmo para encontrar e realizar o teste padrão ou testes padrões. Um modelo preditivo é o resultado do processo de algoritmo de aprendizagem da máquina, que a lógica de negócios identifica os padrões prováveis com novos dados. O aplicativo é usado para fornecer dados para o modelo para saber se o modelo identifica o padrão conhecido com os novos dados. No caso que nós tomamos, os dados novos poderiam ser dados de mais transações. Padrões prováveis significam que um modelo de anteceder com padrões preditivos para verificar se as transações são realmente fraudulentas.

Pra quem?

Vemos a aprendizagem de máquina que escolhe um modelo para anteceder os padrões e é muito popular hoje em dia. A questão é por que? Mas há uma série de razões para responder a esta pergunta.

Em primeiro lugar, se vemos um processo de aprendizagem da máquina, descobrimos que precisamos alimentá-lo com muitos dados. Os dados poderiam ser estruturados ou não-estruturados, e o bom é que temos esses dados. Nesta era de Big Data, nós não só temos um monte de dados, mas também temos o poder da computação para processar esses dados. Não apenas isso, falamos de computação em nuvem que requer algoritmos de aprendizagem de máquina operativa e implícita, que também temos. Todas essas coisas não estavam disponíveis no passado, como estão agora para nós.

Outra questão é quem tem interesse por aprendizagem da máquina? Quem são as pessoas que realmente se preocupam com isso? Muita gente, podemos começar conhecer 3 grandes grupos:

Proprietários de negócios.

Eles sempre precisam de soluções para resolver suas necessidades e problemas de negócios. Por exemplo, para verificar as transações fraudulentas, para verificar a probabilidade de seus clientes mudarem para outros fornecedores. Aprendizagem da máquina, portanto, agrega valor ao negócio, fornecendo melhores soluções e previsões precisas.

Desenvolvedores de software.

Eles se preocupam com a aprendizagem de máquinas para que eles possam construir boas aplicações para resolver problemas de negócios. As aplicações, como vimos no modelo de aprendizagem da máquina, dependem de modelos preditivos criados a partir de algoritmos de aprendizado de máquina para fazer melhores previsões.

Cientistas de dados que realmente precisam de ferramentas eficazes e úteis.

Os cientistas de dados são as pessoas que realmente se importam e têm um profundo conhecimento de estatísticas e ferramentas de aprendizagem de máquinas / softwares, que sabem como codificar e que são realmente especialistas. Os profissionais cientistas de dados são muito limitados no mercado e caros, porque, novamente, eles ajudam as empresas a crescer através da resolução de problemas de negócios, e as empresas em crescimento significa economizar e ganhar mais dinheiro. Assim, os próprios cientistas de dados são um valor para qualquer negócio, pois são um pacote completo de conhecimento, estatísticas, domínio de problemas e aprendizado de máquinas.

Além disso, outro grupo do qual não falamos é de fornecedores que fazem ofertas e serviços de aprendizado de máquinas. Desde que a aprendizagem da máquina é referida muitas vezes como a análise preditiva, há os vendedores que oferecem analises.

Podemos dizer que usando a aprendizagem de máquina podemos encontrar padrões e, em seguida, criar um modelo que reconhece esses padrões com novos dados iterativos. Por último, mas não menos importante, a aprendizagem mecânica pode realmente ajudar qualquer organização a ter sucesso.

IDI Instituto de Desenho Instrucional


63 visualizações