我们在做数据挖掘项目或大数据竞赛时,如果个体是人的时候,获得的数据中可能有出生日期的Series,举个简单例子,比如这样的一些数:
# -*- coding: utf-8 -*-
import pandas as pd
from pandas import Series, Data
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt %matplotlib inline
data = {'birth': ['10/8/00', '7/21/93', '6/14/01', '5/18/99', '1/5/98']}
= Data (data)

从数据来看,"10/8/00'之类的数,最左边的数表示月份,中间的数表示日,最后的数表示年度。
实际上我们在分析时并不需要人的出生日期,而是需要年龄,不同的年龄阶段会有不同的状态,比如收入、健康、居住条件等等,且能够很好地把不同样本的差异性进行大范围的划分,而不是像出生日期那样包含信息量过大且在算法训练时不好作为有效数据进行训练,age是一个很好地特征工程指示变量。
那如何把上述birth数据变为年龄age呢?
在这里用到datetime这个库,如下:
(1)首先把birth转化为标准时间格式
['birth'] = pd.to_datetime( ['birth'])
(2)获取当前时间的年份,并减去birth的年份
import datetime as dt now_year =dt.datetime.today().year #当前的年份 ['age']=now_year- .birth.dt.year
在这里使用了dt.datetime.today().year来获取当前日期的年份,然后将birth数据中的年份数据提取出来( .birth.dt.year),两者相减就得到需要的年龄数据,如下:

有时候我们可能还会关注到人的出生月份与要预测变量的关系,比如人的星座就是很流行的一种以出生月份、日份来评估其对人的影响,也可以按这种方法去提取月、日数据。
总结
以上所述是小编给大家介绍的在Python data 中出生日期转化为年龄的实现方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!
继续阅读与本文标签相同的文章
上一篇 :
php微信公众号开发之关键词回复
下一篇 :
一文解析统计学在机器学习中的重要性
-
淘集集经营模式变更:合伙人自营,主要供应商已成股东合伙人
2026-05-18栏目: 教程
-
88%中国员工相信AI超过经理 人见多了就更喜欢狗?
2026-05-18栏目: 教程
-
删库不要跑,我站起来还可以删
2026-05-18栏目: 教程
-
拼硬件真过时了?卡萨帝冰箱乌镇全讲场景
2026-05-18栏目: 教程
-
哈弗F7有AI更便捷 全球最流行的交互方式了解一下
2026-05-18栏目: 教程
