[Azure] - Sequencia de posts para aprofundar os estudos da certificação Azure AI-900 Fundamentals Exam (2/5)
Leia e pratique essas questões antes de seu exame em português
Recentemente realizei a prova AI-900 em português, por isso, resolvi trazer algumas questões e termos que mudaram para que você obtenha sucesso com essa certificação.
Neste post vamos falar sobre a segunda parte da prova.
Descrever os princípios fundamentais do Machine Learning no Azure (30–35%)
Para esse conjunto, separei algumas questões patrícias baseadas nos seguintes conceitos
- Identificar tipos comuns de Machine Learning
- Descrever os principais conceitos de Machine Learning
- Identificar as principais tarefas na criação de uma solução de Machine Learning
- Descrever os recursos de Machine Learning sem código com o Azure Machine Learning
1. Empresa Rakkun.IO é uma empresa que aluga bicicletas em uma cidade. A empresa pode usar dados históricos para treinar um modelo que preveja a demanda diária de aluguel, a fim de garantir que haja pessoal e ciclos suficientes disponíveis. Qual serviço você deve usar?
Azure Machine Learning
2. Quais são os vários tipos de modelos de Machine Learning?
Regressão, Classificação e Clustering
3. Qual é o processo de Machine Learning independentemente do modelo?
Ingestão de dados
Você precisa obter os dados para treinar seu modelo de pré-processamento de dados. Identifique os recursos que ajudam o modelo a prever e descartar outros dados de limpeza (Data Cleaning).
Corrija quaisquer erros, os itens que contenham erros Substituindo valores de recursos, encontre os valores do recurso de substituição, se algum estiver faltando, esse processo se chama (Replace Feature Values).
Neste processo, você pode usar a engenharia de recursos existente para encontrar os valores Algoritmos Apply.
Aplique algoritmos nestes dados para o processamento até que você esteja satisfeito com o modelo (previsões ou predições) Deploy Model
Finalmente, você implanta seu modelo no serviço de Machine Learning para que os aplicativos possam se conectar a ele.
4. Para usar o Azure Machine Learning, você cria um workspace em sua assinatura do Azure. Isso é verdade?
Sim ! Você pode usar este workspace para gerenciar dados, recursos de computação, código, modelos e outros artefatos relacionados às suas cargas de trabalho de Machine Learning.
5. Qual é a vantagem de usar o serviço de Azure Machine Learning ?
O Azure Machine Learning é uma plataforma baseada em nuvem para criar e operar soluções de Machine Learning no Azure. Inclui uma ampla gama de recursos e capacidades que ajudam os cientistas de dados a preparar dados, treinar modelos, publicar serviços preditivos e monitorar seu uso. Mais importante ainda, ajuda os cientistas de dados a aumentar sua eficiência, automatizando muitas das tarefas demoradas associadas aos modelos de treinamento. E também permite que eles usem recursos de computação baseados em nuvem que escalem com eficiência para lidar com grandes volumes de dados. Enquanto os custos apenas ocorrem quando realmente são usados.
6. Quais são as configurações que você precisa ao criar um WorkSpace para Machine Learning?
Necessário para criação de um Azure machine Learning é:
Uma Assinatura, Resource Group, Storage Account, KeyVault, Application Insigths
7. Quais são os outros recursos adicionados automaticamente ao criar o Machine Learning Workspace?
Armazenamento Azure, Azure Application Insigts, Azure Key Vault
8. O que é Machine Learning Studio?
Você pode gerenciar seu workspace usando o portal do Azure, mas para cientistas e engenheiros de dados, o Azure Machine Learning Studio fornece uma interface de usuário mais focada para gerenciar recursos de espaço de trabalho. Tanto que o endereço é https://ml.azure.com basta acessar com a mesma conta do portal.
9. Quantos tipos de recursos de computação que os cientistas de dados podem usar para treinar seus modelos?
- Instâncias de computação
- Clusters de computação: Podem ser desktops de desenvolvimento que os cientistas de dados podem usar para trabalhar com dados e modelos.
- Clusters de inferência: Clusters escaláveis de máquinas virtuais para processamento sob demanda do código experimental.
- Recursos de computação existentes no Azure , como máquinas virtuais ou clusters do Azure Databricks.
10. Quais são as configurações de que você precisa para criar uma instância de computação?
Nome da Computação: insira um nome exclusivo
Tipo de máquina virtual: CPU ou GPU
Tamanho da máquina virtual: exemplo Standard_DS2_v2
11. Como você se certifica que ira iniciar a computação apenas quando for necessário ao criar clusters de computação no ambiente de produção?
Em um ambiente de produção, você normalmente definiria o número mínimo de valores de nós como 0 para que o cálculo só seja iniciado quando for necessário.
12. No Machine Learning Studio, onde você registra os dados para treinar o modelo?
13. De quantas maneiras você pode importar dados para criar conjuntos de dados?
- De arquivos locais
- Do armazenamento de dados
- De arquivos da web
- De Open Datasets
14. Você criou um conjunto de dados e deseja visualiza-lo. Onde você deverá acessar no Machine Learning Studio?
Após a criação do conjunto de dados, é possível visualizar pelo nome dado no momento da criação, após isso é possível abri-lo e visualizar os dados importados na aba explorar, conforme imagem abaixo.
15. O modelo de _______para prever o valor numérico.
Regressão
16. Que tipo de modelo para produzir o gráfico Previsto vs. Realizado?
Regressão
17. Uma concessionária de automóveis deseja usar dados históricos de vendas de carros para treinar um modelo de Machine Learning. O modelo deve prever o preço de um carro usado com base em características como idade, tamanho do motor e quilometragem. Que tipo de modelo de Machine Learning a concessionária precisa criar?
Regressão
18. Um banco deseja usar registros históricos de amortização de empréstimos para categorizar os pedidos de empréstimo como de baixo ou alto risco com base em características como o valor do empréstimo, a receita do mutuário e o período do empréstimo. Que tipo de modelo de Machine Learning o banco precisa criar?
Classificação
19.Qual tipo de Machine Learning é um exemplo não supervisionado?
Clustering
20. Você está criando um modelo com o designer do Azure Machine Learning. Como primeira etapa, você importa os dados brutos. Quais são as próximas etapas que você precisa fazer para preparar os dados para a modelagem?
21. O que é erro médio absoluto(MAE) Mean Absolute Error?
Calcula o “erro absoluto médio” dos erros entre valores observados (reais) e predições (hipóteses).
22. O que é erro quadrático médio (RMSE) Root Mean Squared Error ?
É a medida que calcula “a raiz quadrática média” dos erros entre valores observados (reais) e predições (hipóteses). Quando comparado ao MAE, uma diferença maior indica maior variância nos erros individuais (por exemplo, com alguns erros sendo muito pequenos, enquanto outros são grandes). Se o MAE e o RMSE forem aproximadamente iguais, então todos os erros individuais são de magnitude semelhante.
23. O que é erro quadrado relativo (RSE) Relative Squared Error ?
Uma métrica relativa entre 0 e 1 com base no quadrado das diferenças entre os valores previstos e verdadeiros. Quanto mais próxima de 0 for essa métrica, melhor será o desempenho do modelo. Como essa métrica é relativa, ela pode ser usada para comparar modelos em que os rótulos estão em unidades diferentes.
24. O que é erro relativo absoluto (RAE) Relative Absolute Error ?
Uma métrica relativa entre 0 e 1 com base nas diferenças absolutas entre os valores previstos e verdadeiros. Quanto mais próxima de 0 for essa métrica, melhor será o desempenho do modelo. Como o RSE, essa métrica pode ser usada para comparar modelos em que os rótulos estão em unidades diferentes.
25. Qual é o Coeficiente de Determinação (R2) Coefficient of Determination?
Essa métrica é mais comumente conhecida como R-quadrado e resume o quanto da variação entre os valores previstos(hipóteses) e observados(reais) é explicada pelo modelo. Quanto mais próximo de 1 for esse valor, melhor será o desempenho do modelo.
26. Você está criando um pipeline de treinamento para um modelo de regressão, usando um conjunto de dados que possui várias colunas numéricas nas quais os valores estão em escalas diferentes. Você deseja transformar as colunas numéricas para que os valores estejam todos em uma escala semelhante com base em relação aos valores mínimo e máximo em cada coluna. Qual módulo você deve adicionar ao pipeline?
Normalizar Dados
27.________ é uma forma de Machine Learning usada para prever a qual categoria ou classe um item pertence.
Classificação
28. Uma clínica de saúde pode usar as características de um paciente (como idade, peso, pressão arterial e assim por diante) para prever se o paciente corre risco de diabetes. Nesse caso, as características do paciente são os recursos, e o rótulo é uma classificação de 0 ou 1, representando não diabético ou diabético. Que tipo de modelo é esse?
Classificação
29. Você está usando o designer do Azure Machine Learning para criar um pipeline de treinamento para um modelo de classificação binária. Você adicionou um conjunto de dados contendo recursos e rótulos, um módulo de floresta de decisão de duas classes e um módulo de modelo de trem. Você planeja usar os módulos Score Model e Evaluate Model para testar o modelo treinado com um subconjunto do conjunto de dados que não foi usado para treinamento. Que tipo de módulo adicional você deve adicionar?
Dividir Dados
30. Qual é a métrica de precisão no modelo de classificação?
A proporção de previsões corretas (verdadeiros positivos + verdadeiros negativos) em relação ao número total de previsões.
31. _________ é uma forma de aprendizado de máquina usada para agrupar itens semelhantes em clusters com base em seus recursos?
Clustering