Python 去除 IP 端口号并去重

要求,该 python 文件和 proxy.txt 文件在同一目录,代码如下

import re

def clean_proxy_file(input_file='proxy.txt', output_file='proxy_clean.txt'):
    """
    处理代理IP文件:去除端口号并去重
    :param input_file: 输入文件名
    :param output_file: 输出文件名
    """
    unique_ips = set()
    
    # 读取文件并处理每一行
    with open(input_file, 'r') as f:
        for line in f:
            line = line.strip()  # 去除换行符和空白字符
            if line:  # 确保不是空行
                # 使用正则表达式匹配IP地址(去除端口号)
                ip_match = re.match(r'^(\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})', line)
                if ip_match:
                    unique_ips.add(ip_match.group(1))  # 添加IP到集合(自动去重)
    
    # 将结果写入新文件
    with open(output_file, 'w') as f:
        for ip in sorted(unique_ips):  # 可选排序
            f.write(ip + '\n')
    
    print(f"处理完成!共找到 {len(unique_ips)} 个唯一IP地址。结果已保存到 {output_file}")

# 执行函数
clean_proxy_file()

运行方式 python xxx.py


Python 去除 IP 端口号并去重
https://uniomo.com/archives/python-qu-chu-ip-duan-kou-hao-bing-qu-chong
作者
雨落秋垣
发布于
2025年06月13日
许可协议