Durante a vida de programador, é muito comum nos depararmos com situações em que precisamos realizar alguns ajustes e operações sobre os textos lidos de arquivos, como remover espaço em branco, colocar todas as letras maiúsculas, substituir e contar palavras. Neste módulo, veremos alguns métodos presentes nos objetos do tipo str (string), que são muito utilizados em conjunto com a manipulação de arquivos.
Ao ler o conteúdo do arquivo, o Python retorna os caracteres de final de linha (\r e \n). Muitas vezes, essa informação não é necessária, principalmente se estivermos tratando uma linha de cada vez.
Dependendo do objetivo, esses caracteres são considerados lixo e podem atrapalhar o processamento que desejamos realizar. Para remover esses caracteres e também espaços em branco adicionais, o tipo str disponibiliza o método strip(). O método strip()
é usado em Python para remover caracteres indesejados no início e no final de uma string. Ele retorna uma nova string após remover todos os caracteres especificados de ambos os lados da string original.
A seguir estão alguns exemplos de como usar o método strip()
:
Removendo espaços em branco:
texto = " Olá, mundo! "
print(texto.strip())
# saída: "Olá, mundo!"
Removendo caracteres específicos:
texto = ".....Olá, mundo!....."
print(texto.strip('.'))
# saída: "Olá, mundo!"
Removendo caracteres apenas no início:
texto = " Olá, mundo! "
print(texto.lstrip())
# saída: "Olá, mundo! "
Removendo caracteres apenas no final:
texto = " Olá, mundo! "
print(texto.rstrip())
# saída: " Olá, mundo!"
Usando o método strip() em um loop:
lista_textos = [" Olá", "mundo! ", " Python "]
for texto in lista_textos:
print(texto.strip())
# saída:
# "Olá"
# "mundo!"
# "Python"
Outra atividade muito comum na manipulação de arquivos é a contagem do número de vezes que determinada palavra aparece. O Python disponibiliza o método count para strings, que recebe como parâmetro a palavra que desejamos contar e retorna o total de ocorrências dela. Sua sintaxe é a seguinte:
contagem = variavel_string.count(palavra)
Contagem de palavras em uma string:
texto = "Python é uma linguagem de programação poderosa e fácil de aprender"
contagem = texto.count("de")
print(contagem) # saída: 1
Verificando a presença de um caractere em uma string:
texto = "Eu amo Python"
if texto.count("o") > 0:
print("A letra 'o' está presente na string")
else:
print("A letra 'o' não está presente na string")
# saída: "A letra 'o' está presente na string"
Contagem de vogais em uma string:
texto = "O Python é incrível!"
vogais = "aeiouAEIOU"
contagem_vogais = sum([texto.count(v) for v in vogais])
print(contagem_vogais)
# saída: 7
Contagem de palavras em um arquivo de texto:
with open("arquivo.txt", "r") as arquivo:
conteudo = arquivo.read()
contagem = conteudo.count("Python")
print(contagem)
# retorna o número de ocorrências da palavra "Python" no arquivo