پانڈاس 1.0 ہمیں کیا لایا

پانڈاس 1.0 ہمیں کیا لایا

9 جنوری کو، پانڈاس 1.0.0rc جاری کیا گیا۔ لائبریری کا پچھلا ورژن 0.25 ہے۔

پہلی بڑی ریلیز میں بہت ساری نئی خصوصیات شامل ہیں، بشمول بہتر خودکار ڈیٹا فریم کا خلاصہ، مزید آؤٹ پٹ فارمیٹس، ڈیٹا کی نئی اقسام، اور یہاں تک کہ ایک نئی دستاویزی سائٹ۔

تمام تبدیلیاں دیکھی جا سکتی ہیں۔ یہاں، مضمون میں ہم خود کو سب سے اہم چیزوں کے ایک چھوٹے، کم تکنیکی جائزے تک محدود رکھیں گے۔

آپ لائبریری کو معمول کے مطابق استعمال کر کے انسٹال کر سکتے ہیں۔ PIP، لیکن چونکہ پانڈا 1.0 لکھنے کے وقت اب بھی ہے۔ رہائی کے امیدوار، آپ کو واضح طور پر ورژن کی وضاحت کرنے کی ضرورت ہوگی:

pip install --upgrade pandas==1.0.0rc0

ہوشیار رہیں: چونکہ یہ ایک بڑی ریلیز ہے، اس لیے اپ ڈیٹ پرانے کوڈ کو توڑ سکتا ہے!

ویسے، اس ورژن کے بعد سے Python 2 کی سپورٹ مکمل طور پر بند کر دی گئی ہے۔ایک اچھی وجہ کیا ہو سکتی ہے اپ ڈیٹ - تقریبا. ترجمہ)۔ پانڈاس 1.0 کو کم از کم ازگر 3.6+ کی ضرورت ہے، لہذا اگر آپ کو یقین نہیں ہے، تو چیک کریں کہ آپ نے کون سا انسٹال کیا ہے:

$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)

$ python --version
Python 3.7.5

پانڈاس ورژن کو چیک کرنے کا سب سے آسان طریقہ یہ ہے:

>>> import pandas as pd
>>> pd.__version__
1.0.0rc0

DataFrame.info کے ساتھ بہتر خودکار خلاصہ

میری پسندیدہ جدت طریقہ کی تازہ کاری تھی۔ DataFrame.info. فنکشن بہت زیادہ پڑھنے کے قابل ہو گیا ہے، جس سے ڈیٹا کی تلاش کا عمل اور بھی آسان ہو گیا ہے:

>>> df = pd.DataFrame({
...:   'A': [1,2,3], 
...:   'B': ["goodbye", "cruel", "world"], 
...:   'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      object
 2   C       3 non-null      object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes

مارک ڈاون فارمیٹ میں آؤٹ پٹ ٹیبلز

یکساں طور پر خوشگوار اختراع یہ ہے کہ ڈیٹا فریم کو مارک ڈاون ٹیبلز پر ایکسپورٹ کرنے کی صلاحیت DataFrame.to_markdown.

>>> df.to_markdown()
|    |   A | B       | C     |
|---:|----:|:--------|:------|
|  0 |   1 | goodbye | False |
|  1 |   2 | cruel   | True  |
|  2 |   3 | world   | False |

اس سے گیتھب گسٹ کا استعمال کرتے ہوئے میڈیم جیسی سائٹوں پر ٹیبل شائع کرنا بہت آسان ہوجاتا ہے۔

پانڈاس 1.0 ہمیں کیا لایا

تاروں اور بولین کے لیے نئی اقسام

پانڈاس 1.0 ریلیز نے بھی نیا اضافہ کیا۔ تجرباتی اقسام ان کا API اب بھی تبدیل ہو سکتا ہے، لہذا اسے احتیاط کے ساتھ استعمال کریں۔ لیکن عام طور پر، پانڈاس تجویز کرتے ہیں کہ نئی قسمیں استعمال کریں جہاں یہ سمجھ میں آتا ہے۔

ابھی کے لیے، کاسٹ کو واضح طور پر کرنے کی ضرورت ہے:

>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      string
 2   C       3 non-null      bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes

کالم کس طرح نوٹس ٹائپ نئی اقسام دکھاتا ہے۔ سٹرنگ и بول.

نئی سٹرنگ ٹائپ کی سب سے مفید خصوصیت سلیکٹ ایبلٹی ہے۔ صرف قطار کے کالم ڈیٹا فریم سے یہ ٹیکسٹ ڈیٹا کو پارس کرنا بہت آسان بنا سکتا ہے:

df.select_dtypes("string")

پہلے، واضح طور پر نام بتائے بغیر قطار کے کالم منتخب نہیں کیے جا سکتے تھے۔

آپ نئی اقسام کے بارے میں مزید پڑھ سکتے ہیں۔ یہاں.

پڑھنے کے لیے آپ کا شکریہ! تبدیلیوں کی مکمل فہرست، جیسا کہ پہلے ہی ذکر کیا گیا ہے، دیکھا جا سکتا ہے۔ یہاں.

ماخذ: www.habr.com

نیا تبصرہ شامل کریں