colindix · July 8, 2019 08:39
diff --git a/sparkusertokenregex.py b/sparkusertokenregex.py
 # ### This one works in the dataframe syntax
 dfuserrgx1 = r"\\users\\[^\\]+\\"
 dfuserrgx2 = r"\\userdata\\[^\\]+\\"
 #userrgx3 = r'\bS-1-5-21-\d{8,10}-\d{8,10}-\d{8,10}-\d{5,10}\b'
 dfuserrgx3 = r'S-1-5-21-\d{8,10}-\d{8,10}-\d{8,10}-\d{5,10}'
 dfusermatch = f"(?i)(?:{dfuserrgx1})|(?:{dfuserrgx2})|(?:{dfuserrgx3})"

 ################################################################

 # ### Works in SQL - can reduce these to 4 x backslashes if raw strings are used
 sqluserrgx1 = r"\\\\users\\\\[^\\\\]+\\\\"
 sqluserrgx2 = r"\\\\\userdata\\\\[^\\\\]+\\\\"
 #userrgx3 = r'\\bS-1-5-21-\\d{8,10}-\\d{8,10}-\\d{8,10}-\\d{5,10}\\b'
 sqluserrgx3 = r'S-1-5-21-\\d{8,10}-\\d{8,10}-\\d{8,10}-\\d{5,10}'
 sqlusermatch = f"(?i)(?:{sqluserrgx1})|(?:{sqluserrgx2})|(?:{sqluserrgx3})"
	# ### This one works in the dataframe syntax
	dfuserrgx1 = r"\\users\\[^\\]+\\"
	dfuserrgx2 = r"\\userdata\\[^\\]+\\"
	#userrgx3 = r'\bS-1-5-21-\d{8,10}-\d{8,10}-\d{8,10}-\d{5,10}\b'
	dfuserrgx3 = r'S-1-5-21-\d{8,10}-\d{8,10}-\d{8,10}-\d{5,10}'
	dfusermatch = f"(?i)(?:{dfuserrgx1})\|(?:{dfuserrgx2})\|(?:{dfuserrgx3})"

	################################################################

	# ### Works in SQL - can reduce these to 4 x backslashes if raw strings are used
	sqluserrgx1 = r"\\\\users\\\\[^\\\\]+\\\\"
	sqluserrgx2 = r"\\\\\userdata\\\\[^\\\\]+\\\\"
	#userrgx3 = r'\\bS-1-5-21-\\d{8,10}-\\d{8,10}-\\d{8,10}-\\d{5,10}\\b'
	sqluserrgx3 = r'S-1-5-21-\\d{8,10}-\\d{8,10}-\\d{8,10}-\\d{5,10}'
	sqlusermatch = f"(?i)(?:{sqluserrgx1})\|(?:{sqluserrgx2})\|(?:{sqluserrgx3})"
No results found