ricardocuellar · December 9, 2025 22:45
diff --git a/analyze_words.py b/analyze_words.py
 SPANISH_STOPWORDS = {
    "de", "la", "que", "el", "en", "y", "a", "los", "del", "se", "las",
    "por", "un", "para", "con", "no", "una", "su", "al", "lo", "como",
    "más", "mas", "o", "pero", "sus", "le", "ya", "si", "porque", "cuando",
    "muy", "sin", "sobre", "también", "tambien", "me", "hasta", "hay",
    "donde", "han", "quien", "entre", "está", "esta", "ser", "son",
 }


 def tokenize(text: str) -> List[str]:
    text = text.lower()
    return re.findall(r"[a-záéíóúüñ]+", text, flags=re.IGNORECASE)
	SPANISH_STOPWORDS = {
	"de", "la", "que", "el", "en", "y", "a", "los", "del", "se", "las",
	"por", "un", "para", "con", "no", "una", "su", "al", "lo", "como",
	"más", "mas", "o", "pero", "sus", "le", "ya", "si", "porque", "cuando",
	"muy", "sin", "sobre", "también", "tambien", "me", "hasta", "hay",
	"donde", "han", "quien", "entre", "está", "esta", "ser", "son",
	}


	def tokenize(text: str) -> List[str]:
	text = text.lower()
	return re.findall(r"[a-záéíóúüñ]+", text, flags=re.IGNORECASE)
No results found