O QUE É R?
O R é uma linguagem e ambiente voltados para estatística computacional e gráficos. Aberto e gratuito, é compatível com Windows, UNIX e MacOS. Atualmente o R se encontra em sua versão 3.4.3.
Apenas para evitar a confusão, o R pode se referir as duas coisas: ao software utilizado para executar o código escrito na linguagem R e à linguagem em si. Para mais informações, podemos visitar o site do Projeto R
Bibliografia indicada
- R in a Nutshell: A Desktop Quick Reference (Adler 2012)
- Learning R: A Step-by-Step Function Guide to Data Analysis (Cotton 2013)
- R for Data Science: Import, Tidy, Transform, Visualize, and Model Data (Wickham and Grolemund 2016)
- 25 Recipes for Getting Started with R (Teetor 2011a)
- R Cookbook: Proven Recipes for Data Analysis, Statistics, and Graphics (Teetor 2011b)
- The Essential R Reference (Gardener 2012)
INICIANDO O USO DO R
Instalando o R
Para instalar o R, basta seguir os seguintes passos:
- Visite um dos CRAN Mirros fazer o download do software. Sugerimos: (https://vps.fmvz.usp.br/CRAN/);
- Escolha a versão para o seu sistema operacional (Linux, Mac OS ou Windows);
- Na página seguinte, escolha a versão base;
- Baixe o arquivo disponível no link e instale!
Instalando o RStudio
O RStudio é um ambiente de interface gráfica para o R, ou melhor, um IDE (Integrated Development Environment). Atualmente o RStudio é considerado o melhor IDE para quem programa em R. Além de uma interface mais amigável, possui diversas funcionalidades que facilitam o aprendizado e a produtividade. O RStudio possui uma versão para desktop grátis e para baixar e instalar, basta seguir os seguintes passos:
- Ir até a página de download do RStudio;
- Clicar em download para a versão grátis;
- Escolher o instalador de acordo com o seu sistema operacional (Windows, Mac OS, Linux);
- Após o download, realizar a instalação.
Preparando o ambiente de trabalho
Uma das primeiras coisas a se fazer antes de começarmos a utilizar o RStudio é definirmos o nosso diretório de trabalho. Para verificar o diretório atual, podemos executar o comando getwd()
no console.
OPERAÇÕES BÁSICA UTILIZANDO R
Tipos numéricos
Recorrentemente lidamos com diferentes classes numéricas no R. Podemos nos deparar com números inteiros (integer), números decimais (numeric ou double) ou números complexos (complex). Para verificarmos a classe de um número, basta usarmos a função class()
no número ou na variável que desejamos testar. Vejamos os exemplos a seguir:
class(3L) #Um número inteiro pode também ser representado acompanhado de um L
[1] "integer"
integer
class(3.435)
[1] "numeric"
numeric
class(3 + 3i)
[1] "complex"
complex
NOTA: Para representar o infinito, o R utiliza Inf
e -Inf
. Faça o teste realizando a seguinte operação no console: 1 / 0
Operações lógicas
As operações lógicas são frequentemente utilizadas no R, principalmente na construção de funções. Diversas linguagens de programação utilizam a lógica booleana em que os valores lógicos podem ser TRUE ou FALSE. No R, além dos estados TRUE
ou FALSE
, há também um terceiro para indicar valor ausente (missing value) identificado por NA
. Tais valores são reservados no R, o que indica que você não poderá criar variáveis com tais nomes. É importante destacar que o R é case sensitive, o que indica que existe a diferenciação entre letras maiúsculas e minúsculas. Portanto, quando formos representar os estados TRUE
, FALSE
ou NA
, sempre temos que escrever com todas as letras maiúsculas.
Também podemos representar TRUE
e FALSE
digitando apenas a primeira letra maiúscula. Faça os exemplos abaixo e analise os resultados do console.
3 > 5
48 != 10
TRUE == T
39 > 100
(30 > 10) & (4 < 3)
F == TRUE
TRUE + TRUE
FALSE / 2
NA + 3
TRUE + NA
class(TRUE)
NOTA: Devemos ter bastante cuidado com os valores ausentes (NA
). Caso não haja o tratamento correto, tais valores podem interferir sensivelmente no código executado. Veremos isso com mais clareza ao longo do nosso curso.
Criando variáveis
Até então realizamos algumas operações sem a necessidade de armazenar dados. No entanto, em operações mais complexas é praticamente impossível não utilizarmos variáveis. Com a criação de uma variável, podemos facilmente reusá-la ao longo de nosso código. Vejamos um exemplo.
x <- 3
x + 10
[1] 13
No exemplo anterior, criamos uma variável x
para armazenar o valor numérico 3. Ao realizarmos a operação x + 10
, automaticamente o valor atribuído a x
é recuperado. Para criarmos uma variável, utilizamos o símbolo <-
ou =
. No entanto, a notação <-
é a mais utilizada e será a adotada ao longo do nosso curso. Faça o exemplo seguinte e analise os resultados.
x <- 25
x = 30
31 -> x
x <- x + 1
Os nomes das variáveis podem conter letras, números, pontos e sublinha (_
), mas não podem iniciar com um número ou um ponto seguido de número.
NOTA: Por questão de estética e praticidade, é recomendável que você mantenha os nomes das variáveis apenas com letras minúsculas. As variáveis devem ter nomes curtos e revelar um pouco da informação que guarda. Isso facilitará a leitura do código!
Outra forma de criarmos variáveis é utilizando a função assign()
, apesar de menos usual. Vejamos um exemplo a seguir.
assign("x", 99) #Note que é necessária a utilização de aspas para indicar o nome da variável
x
[1] 99
Outras classes de variáveis
