పాండాలు 1.0 మాకు ఏమి అందించింది

పాండాలు 1.0 మాకు ఏమి అందించింది

జనవరి 9న, పాండాస్ 1.0.0rc విడుదలైంది. లైబ్రరీ యొక్క మునుపటి సంస్కరణ 0.25.

మొదటి ప్రధాన విడుదలలో మెరుగైన ఆటోమేటిక్ డేటాఫ్రేమ్ సారాంశం, మరిన్ని అవుట్‌పుట్ ఫార్మాట్‌లు, కొత్త డేటా రకాలు మరియు కొత్త డాక్యుమెంటేషన్ సైట్‌తో సహా అనేక గొప్ప కొత్త ఫీచర్లు ఉన్నాయి.

అన్ని మార్పులను వీక్షించవచ్చు ఇక్కడ, వ్యాసంలో మనం అతి ముఖ్యమైన విషయాల యొక్క చిన్న, తక్కువ సాంకేతిక సమీక్షకు పరిమితం చేస్తాము.

మీరు ఎప్పటిలాగే లైబ్రరీని ఇన్‌స్టాల్ చేసుకోవచ్చు విత్తనము, కానీ పాండాలు వ్రాసే సమయంలో 1.0 ఇప్పటికీ ఉంది అభ్యర్థిని విడుదల చేయండి, మీరు సంస్కరణను స్పష్టంగా పేర్కొనాలి:

pip install --upgrade pandas==1.0.0rc0

జాగ్రత్తగా ఉండండి: ఇది ప్రధాన విడుదల అయినందున, నవీకరణ పాత కోడ్‌ను విచ్ఛిన్నం చేయవచ్చు!

మార్గం ద్వారా, ఈ సంస్కరణ నుండి పైథాన్ 2కి మద్దతు పూర్తిగా నిలిపివేయబడింది (ఏది మంచి కారణం కావచ్చు నవీకరణ - సుమారు అనువాదం) పాండాస్ 1.0కి కనీసం పైథాన్ 3.6+ అవసరం, కనుక మీకు ఖచ్చితంగా తెలియకపోతే, మీరు ఏది ఇన్‌స్టాల్ చేసారో తనిఖీ చేయండి:

$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)

$ python --version
Python 3.7.5

పాండాస్ సంస్కరణను తనిఖీ చేయడానికి సులభమైన మార్గం ఇది:

>>> import pandas as pd
>>> pd.__version__
1.0.0rc0

DataFrame.infoతో మెరుగైన స్వీయ సారాంశం

నాకు ఇష్టమైన ఆవిష్కరణ పద్ధతికి నవీకరణ DataFrame.info. ఫంక్షన్ మరింత చదవదగినదిగా మారింది, డేటా అన్వేషణ ప్రక్రియను మరింత సులభతరం చేస్తుంది:

>>> df = pd.DataFrame({
...:   'A': [1,2,3], 
...:   'B': ["goodbye", "cruel", "world"], 
...:   'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      object
 2   C       3 non-null      object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes

మార్క్‌డౌన్ ఆకృతిలో పట్టికలను అవుట్‌పుట్ చేస్తోంది

ఉపయోగించి మార్క్‌డౌన్ పట్టికలకు డేటాఫ్రేమ్‌లను ఎగుమతి చేసే సామర్థ్యం సమానంగా ఆహ్లాదకరమైన ఆవిష్కరణ DataFrame.to_markdown.

>>> df.to_markdown()
|    |   A | B       | C     |
|---:|----:|:--------|:------|
|  0 |   1 | goodbye | False |
|  1 |   2 | cruel   | True  |
|  2 |   3 | world   | False |

ఇది గిథబ్ జిస్ట్‌లను ఉపయోగించి మీడియం వంటి సైట్‌లలో పట్టికలను ప్రచురించడం చాలా సులభం చేస్తుంది.

పాండాలు 1.0 మాకు ఏమి అందించింది

స్ట్రింగ్స్ మరియు బూలియన్స్ కోసం కొత్త రకాలు

పాండాస్ 1.0 విడుదల కూడా కొత్తదనాన్ని జోడించింది ప్రయోగాత్మకమైన రకాలు. వారి API ఇప్పటికీ మారవచ్చు, కాబట్టి దీన్ని జాగ్రత్తగా ఉపయోగించండి. కానీ సాధారణంగా, పాండాలు అర్ధమయ్యే చోట కొత్త రకాలను ఉపయోగించమని సిఫార్సు చేస్తారు.

ప్రస్తుతానికి, తారాగణం స్పష్టంగా చేయాల్సి ఉంది:

>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      string
 2   C       3 non-null      bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes

కాలమ్ ఎలా ఉందో గమనించండి డిటైప్ చేయండి కొత్త రకాలను ప్రదర్శిస్తుంది - స్ట్రింగ్ и bool.

కొత్త స్ట్రింగ్ రకం యొక్క అత్యంత ఉపయోగకరమైన లక్షణం ఎంచుకునే సామర్థ్యం వరుస నిలువు వరుసలు మాత్రమే డేటాఫ్రేమ్‌ల నుండి. ఇది టెక్స్ట్ డేటాను చాలా సులభతరం చేస్తుంది:

df.select_dtypes("string")

మునుపు, పేర్లను స్పష్టంగా పేర్కొనకుండా అడ్డు వరుసల నిలువు వరుసలు ఎంపిక చేయబడవు.

మీరు కొత్త రకాల గురించి మరింత చదువుకోవచ్చు ఇక్కడ.

చదివినందుకు ధన్యవాదములు! ఇప్పటికే పేర్కొన్న విధంగా మార్పుల పూర్తి జాబితాను చూడవచ్చు ఇక్కడ.

మూలం: www.habr.com

ఒక వ్యాఖ్యను జోడించండి