最新公告
  • 欢迎您光临起源地模板网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入钻石VIP
  • 如何用python读CSV表格

    正文概述    2020-03-13   163

    如何用python读CSV表格

    用python读CSV表格的方法:

    1、使用PythonI/O读取csv文件

    使用python I/O方法进行读取时即是新建一个List 列表然后按照先行后列的顺序(类似C语言中的二维数组)将数据存进空的List对象中,如果需要将其转化为numpy 数组也可以使用np.array(List name)进行对象之间的转化。

    birth_data = []
    with open(birth_weight_file) as csvfile:
        csv_reader = csv.reader(csvfile)  # 使用csv.reader读取csvfile中的文件
        birth_header = next(csv_reader)  # 读取第一行每一列的标题
        for row in csv_reader:  # 将csv 文件中的数据保存到birth_data中
            birth_data.append(row)
    
    birth_data = [[float(x) for x in row] for row in birth_data]  # 将数据从string形式转换为float形式
    
    birth_data = np.array(birth_data)  # 将list数组转化成array数组便于查看数据结构
    birth_header = np.array(birth_header)
    print(birth_data.shape)  # 利用.shape查看结构。
    print(birth_header.shape)
    #
    # (189, 9)
    # (9,)

    2、使用Pandas读取CSV文件

    import pandas as pd
    
    csv_data = pd.read_csv('birth_weight.csv')  # 读取训练数据
    print(csv_data.shape)  # (189, 9)
    N = 5
    csv_batch_data = csv_data.tail(N)  # 取后5条数据
    print(csv_batch_data.shape)  # (5, 9)
    train_batch_data = csv_batch_data[list(range(3, 6))]  # 取这20条数据的3到5列值(索引从0开始)
    print(train_batch_data)
    
    #      RACE  SMOKE  PTL
    # 184   0.0    0.0  0.0
    # 185   0.0    0.0  1.0
    # 186   0.0    1.0  0.0
    # 187   0.0    0.0  0.0
    # 188   0.0    0.0  1.0

    3、使用Tensorflow读取CSV文件

    '''使用Tensorflow读取csv数据'''
    filename = 'birth_weight.csv'
    file_queue = tf.train.string_input_producer([filename])  # 设置文件名队列,这样做能够批量读取文件夹中的文件
    reader = tf.TextLineReader(skip_header_lines=1)  # 使用tensorflow文本行阅读器,并且设置忽略第一行
    key, value = reader.read(file_queue)
    defaults = [[0.], [0.], [0.], [0.], [0.], [0.], [0.], [0.], [0.]]  # 设置列属性的数据格式
    LOW, AGE, LWT, RACE, SMOKE, PTL, HT, UI, BWT = tf.decode_csv(value, defaults)
    # 将读取的数据编码为我们设置的默认格式
    vertor_example = tf.stack([AGE, LWT, RACE, SMOKE, PTL, HT, UI])  # 读取得到的中间7列属性为训练特征
    vertor_label = tf.stack([BWT])  # 读取得到的BWT值表示训练标签
    
    # 用于给取出的数据添加上batch_size维度,以批处理的方式读出数据。可以设置批处理数据大小,是否重复读取数据,容量大小,队列末尾大小,读取线程等属性。
    example_batch, label_batch = tf.train.shuffle_batch([vertor_example, vertor_label], batch_size=10, capacity=100, min_after_dequeue=10)
    
    # 初始化Session
    with tf.Session() as sess:
        coord = tf.train.Coordinator()  # 线程管理器
        threads = tf.train.start_queue_runners(coord=coord)
        print(sess.run(tf.shape(example_batch)))  # [10  7]
        print(sess.run(tf.shape(label_batch)))  # [10  1]
        print(sess.run(example_batch)[3])  # [ 19.  91.   0.   1.   1.   0.   1.]
        coord.request_stop()
        coord.join(threads)
    
    '''
    对于使用所有Tensorflow的I/O操作来说开启和关闭线程管理器都是必要的操作
    with tf.Session() as sess:
        coord = tf.train.Coordinator()  # 线程管理器
        threads = tf.train.start_queue_runners(coord=coord)
        #  Your code here~
        coord.request_stop()
        coord.join(threads)
    '''

    更多Python知识请关注Python视频教程栏目。


    起源地下载网 » 如何用python读CSV表格

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    模板不会安装或需要功能定制以及二次开发?
    请QQ联系我们

    发表评论

    还没有评论,快来抢沙发吧!

    如需帝国cms功能定制以及二次开发请联系我们

    联系作者

    请选择支付方式

    ×
    迅虎支付宝
    迅虎微信
    支付宝当面付
    余额支付
    ×
    微信扫码支付 0 元