get_filename_list.py

小编 2026-06-11 阅读:1339 评论:0
#!/usr/bin/env python3 # -*- coding: utf-8 -*- \"\"\" Created on Fri Dec 21 09:42:44 2018 @author: xiao...

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
\"\"\"
Created on Fri Dec 21 09:42:44 2018
@author: xiaopang
\"\"\"
import torch.utils.data as data
import torch
from scipy.ndimage import imread
import os ,shutil
import os.path
import glob
import random

def make_train_val_filename_list_v0(path,val_percent=0.05,val=True): #这个函数写的不太好,只能用与生成训练时候数据样本的文件名称列表
  \'\'\'
  本函数用于将path目录下的img和mask文件分成两部分:train训练和val
  将分离后的文件名字分别写道train和val字典中
  path:原图片文件的路径
  val_percent:验证图片集合val占比
  val :一个开关,决定是否将原始图片分割成训练集合和验证集合
       如果val=True 则分别返回训练集合与验证集合文件名子的列表,
       列表中的每个元素也是列表,[img_filename,mask_filename]
  这个函数是使用os.walk(path)函数获得path目录下的文件名称。
  \'\'\'
    #cwd= os.getcwd()
    #sep=os.path.sep #获取当前OS中使用的路径名称分隔符
    #img_path  = cwd +sep + \'data\'+sep+\'train\' +sep +\'image\' #获取指定路径
    #label_path= cwd +sep + \'data\'+sep+\'train\' +sep +\'mask\'
#    img_path  = self.cf.train_data_path  #获取指定路径
#    label_path= self.cf.train_label_path
#    print(path)
  img_label=[]
  for root,dirs,files in os.walk(path):
      for name in files:
          tmp_name=os.path.splitext(name)[0] +\'_mask\' + os.path.splitext(name)[1]
          label_name = os.path.join(root, tmp_name)
          img_name = os.path.join(root, name)
          img_label.append([img_name,label_name])
  if val:
    length = len(img_label)
    n = int(length * val_percent)
    random.shuffle(img_label)
    return {\'train\': img_label[:-n], \'val\': img_label[-n:]} #把洗牌后的数据列表分割成两个子集合.以字典存储形式
  else:
    return img_label

    def get_filename_list(root):
  \'\'\'
  本函数用于获取指定目录下面文件名子的列表,返回该列表
  \'\'\'
  dataset = []
  for root,dirs,files in os.walk(root):
    for name in files:
      dataset.append(os.path.join(root, name))
  for i in range(len(dataset)):
    print(dataset[i])
  return dataset

def make_train_val_filename_list(path,val_percent=0.05,val=True):
  \'\'\'
  这个函数是:make_train_val_filename_list_v0函数的另外一个实现版本,二者功能一样
  这个函数是使用glob.glob函数获得path目录下的文件名称。
  本函数用于将path目录下的img和mask文件分成两部分:train训练和val
  将分离后的文件名字分别写道train和val字典中
  path:原图片文件的路径
  val_percent:验证图片集合val占比
  val :一个开关,决定是否将原始图片分割成训练集合和验证集合
       如果val=True 则分别返回训练集合与验证集合文件名子的列表,
       列表中的每个元素也是列表,[img_filename,mask_filename]
 
  \'\'\'
  #root :root path of image and label path
  # train  sub filders name  under the root path
  dataset = []
  glob_name = os.path.join(path, \'*_mask.jpg\')  #类似于 ./data/*.jpg
  for fGT in glob.glob(glob_name): #list the *_mask.jpg in the dir folder
    fName = os.path.basename(fGT)   #  mask file name
    fImg = fName[:-9] + \'.jpg\'      # image file name ,remove \"_mask\"
    dataset.append( [os.path.join(path, fImg), os.path.join(path, fName)] )
  if val:
    length = len(dataset)
    n = int(length * val_percent)
    random.shuffle(dataset)
    return {\'train\': dataset[:-n], \'val\': dataset[-n:]} #把洗牌后的数据列表分割成两个子集合.以字典存储形式
  else:
    return dataset

if __name__ == \"__main__\":
  ROOT = \'/home/xiaopang//data/\'  #指向数据的根目录
  DATA_SRC = ROOT + \'src/\'   #指向数据的原始图片目录
  DATA_DST_TRAIN = DATA_SRC + \'train/\'  #指向存放测试图片的路径
  DATA_DST_VAL = DATA_SRC + \'val/\'  #指向用于存放验证图片的路径
 
#  dataset = make_train_val_filename_list_v0(DATA_SRC)
  dataset = make_train_val_filename_list(DATA_SRC)
  train = dataset[\'train\']
  val   = dataset[\'val\']
 
 
  ###########################################################################
  #copy files from .data/src to \".data/train\" and \".data/val\" folders
  for file_name in train:
    img_src = file_name[0]
    label_src = file_name[1]
    img_dst   = DATA_DST_TRAIN + os.path.basename(img_src)
    label_dst = DATA_DST_TRAIN + os.path.basename(label_src)
    print(img_dst)
    print(label_dst)
#    shutil.copyfile(img_src   ,img_dst )
#    shutil.copyfile(label_src ,label_dst )
  for file_name in val:
    img_src = file_name[0]
    label_src = file_name[1]
    img_dst   = DATA_DST_VAL + os.path.basename(img_src)
    label_dst = DATA_DST_VAL + os.path.basename(label_src)
    print(img_dst)
    print(label_dst)
#    shutil.copyfile(img_src   ,img_dst )
#    shutil.copyfile(label_src ,label_dst)
##############################################################################
    

############################################################################
    
    #remove files in the train and val folders
  train=get_filename_list(DATA_DST_TRAIN)
  for file_name in train:
    print(file_name)
    img = file_name[0]
    label = file_name[1]
#    os.remove(img)
#    os.remove(label)
    
  val = get_filename_list(DATA_DST_VAL)
  for file_name in val:
    print(file_name)
    img = file_name[0]
    label = file_name[1]
#    os.remove(img)
#    os.remove(label)
#############################################################################

 

版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

热门文章
  • 机房智能化温湿度解决方式之POE供电以太网温湿度传感器

    机房智能化温湿度解决方式之POE供电以太网温湿度传感器
    机房智能化温湿度解决方式之POE供电以太网温湿度传感器 北京盈创力和电子科技有限公司 智能型TCP网口温湿度记录仪 北京IP网络温湿度记录仪厂家,北京盈创力和 北京智能型TCP网口温湿度记录仪IP网络温湿度记录仪是一种新型的基于TCP/IP协议双绞线以太网标准温湿度采集模块,利用它可以实现现场温度值、相对湿度值的采集,同时利用其自身的RJ45通信接口可以方便地和机房监控主机或交换机集线器进行联网。 工作于-40℃~85℃工业级带...
  • Sequential Monte Carlo Methods (SMC) 序列蒙特卡洛/粒子滤波/Bootstrap Filtering

    Sequential Monte Carlo Methods (SMC) 序列蒙特卡洛/粒子滤波/Bootstrap Filtering
    Problem Statement 我们考虑一个具有马尔可夫性质、非线性、非高斯的状态空间模型(State Space Model):对于一个时间序列上的观测结果{yt,t∈N}\\{ y_t , t \\in N \\}{yt​,t∈N},我们认为每个观测结果yty_tyt​的生成依赖于一个无法直接观察的隐变量xt∈{xt,t∈N}x_t \\in \\{x_t , t \\in N \\}xt​∈{xt​,t∈N},即:p(...
  • HTTP状态保持的原理

    HTTP状态保持的原理
    a)在用户登录之后,浏览器返回响应的时候会在响应中添加上cookieb)浏览器接收到cookie之后会自动保存c)当用户再次请求同一服务器中的其他网页的时候,浏览器会自动带上之前保存的cookied)服务接收到请求之后可以请 request 对象中取到cookie 判断当前用户是否登录  Http是无状态的,就是连接时数据互通,关闭后...
  • Hive 系统函数及示例

    Hive 系统函数及示例
    查看所有系统函数 show functions; 函数分类 内置函数【系统函数】 数学函数: floor、round、ceil、cos、log2等 字符串函数: length、reverse、trim、lower、get_json_object、repeat等 收集函数: size 转换函数: cast 日期函数: year、month、datediff、date、date_add等 条件函数: coalesce、case…w...
  • CSRF的原理和防范措施

    CSRF的原理和防范措施
    a)攻击原理:i.用户C访问正常网站A时进行登录,浏览器保存A的cookieii.用户C再访问攻击网站B,网站B上有某个隐藏的链接或者图片标签会自动请求网站A的URL地址,例如表单提交,传指定的参数iii.而攻击网站B在访问网站A的时候,浏览器会自动带上网站A的cookieiv.所以网站A在接收到请求之后可判断当前用户是登录状态,所以...
标签列表