జనవరి 9న, పాండాస్ 1.0.0rc విడుదలైంది. లైబ్రరీ యొక్క మునుపటి సంస్కరణ 0.25.
మొదటి ప్రధాన విడుదలలో మెరుగైన ఆటోమేటిక్ డేటాఫ్రేమ్ సారాంశం, మరిన్ని అవుట్పుట్ ఫార్మాట్లు, కొత్త డేటా రకాలు మరియు కొత్త డాక్యుమెంటేషన్ సైట్తో సహా అనేక గొప్ప కొత్త ఫీచర్లు ఉన్నాయి.
అన్ని మార్పులను వీక్షించవచ్చు
మీరు ఎప్పటిలాగే లైబ్రరీని ఇన్స్టాల్ చేసుకోవచ్చు విత్తనము, కానీ పాండాలు వ్రాసే సమయంలో 1.0 ఇప్పటికీ ఉంది అభ్యర్థిని విడుదల చేయండి, మీరు సంస్కరణను స్పష్టంగా పేర్కొనాలి:
pip install --upgrade pandas==1.0.0rc0
జాగ్రత్తగా ఉండండి: ఇది ప్రధాన విడుదల అయినందున, నవీకరణ పాత కోడ్ను విచ్ఛిన్నం చేయవచ్చు!
మార్గం ద్వారా, ఈ సంస్కరణ నుండి పైథాన్ 2కి మద్దతు పూర్తిగా నిలిపివేయబడింది (ఏది మంచి కారణం కావచ్చు
$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)
$ python --version
Python 3.7.5
పాండాస్ సంస్కరణను తనిఖీ చేయడానికి సులభమైన మార్గం ఇది:
>>> import pandas as pd
>>> pd.__version__
1.0.0rc0
DataFrame.infoతో మెరుగైన స్వీయ సారాంశం
నాకు ఇష్టమైన ఆవిష్కరణ పద్ధతికి నవీకరణ DataFrame.info. ఫంక్షన్ మరింత చదవదగినదిగా మారింది, డేటా అన్వేషణ ప్రక్రియను మరింత సులభతరం చేస్తుంది:
>>> df = pd.DataFrame({
...: 'A': [1,2,3],
...: 'B': ["goodbye", "cruel", "world"],
...: 'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null object
2 C 3 non-null object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes
మార్క్డౌన్ ఆకృతిలో పట్టికలను అవుట్పుట్ చేస్తోంది
ఉపయోగించి మార్క్డౌన్ పట్టికలకు డేటాఫ్రేమ్లను ఎగుమతి చేసే సామర్థ్యం సమానంగా ఆహ్లాదకరమైన ఆవిష్కరణ DataFrame.to_markdown.
>>> df.to_markdown()
| | A | B | C |
|---:|----:|:--------|:------|
| 0 | 1 | goodbye | False |
| 1 | 2 | cruel | True |
| 2 | 3 | world | False |
ఇది గిథబ్ జిస్ట్లను ఉపయోగించి మీడియం వంటి సైట్లలో పట్టికలను ప్రచురించడం చాలా సులభం చేస్తుంది.
స్ట్రింగ్స్ మరియు బూలియన్స్ కోసం కొత్త రకాలు
పాండాస్ 1.0 విడుదల కూడా కొత్తదనాన్ని జోడించింది ప్రయోగాత్మకమైన రకాలు. వారి API ఇప్పటికీ మారవచ్చు, కాబట్టి దీన్ని జాగ్రత్తగా ఉపయోగించండి. కానీ సాధారణంగా, పాండాలు అర్ధమయ్యే చోట కొత్త రకాలను ఉపయోగించమని సిఫార్సు చేస్తారు.
ప్రస్తుతానికి, తారాగణం స్పష్టంగా చేయాల్సి ఉంది:
>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null string
2 C 3 non-null bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes
కాలమ్ ఎలా ఉందో గమనించండి డిటైప్ చేయండి కొత్త రకాలను ప్రదర్శిస్తుంది - స్ట్రింగ్ и bool.
కొత్త స్ట్రింగ్ రకం యొక్క అత్యంత ఉపయోగకరమైన లక్షణం ఎంచుకునే సామర్థ్యం వరుస నిలువు వరుసలు మాత్రమే డేటాఫ్రేమ్ల నుండి. ఇది టెక్స్ట్ డేటాను చాలా సులభతరం చేస్తుంది:
df.select_dtypes("string")
మునుపు, పేర్లను స్పష్టంగా పేర్కొనకుండా అడ్డు వరుసల నిలువు వరుసలు ఎంపిక చేయబడవు.
మీరు కొత్త రకాల గురించి మరింత చదువుకోవచ్చు
చదివినందుకు ధన్యవాదములు! ఇప్పటికే పేర్కొన్న విధంగా మార్పుల పూర్తి జాబితాను చూడవచ్చు
మూలం: www.habr.com