for根據ID去重_使用id（）了解Python中的6個關鍵概念1.一切都是Python中的對象2.變量配置設定和别名3.比較運算符：== vs. is4.整數緩存5.淺層和深層副本6.資料可變性不可變與可變總結

> Photo by Tianyi Ma on Unsplash.

啟動任何Python解釋器時，都有70多個内置函數可用。每個Python學習者都不應不熟悉一些普通的學習者。例如，我們可以使用len()來擷取對象的長度，例如清單或字典中的項目數。再舉一個例子，我們可以使用print()列印出感興趣的對象，以進行學習和調試。

此外，幾乎所有Python程式員都應該在教程中看到内置的id()函數的使用，以用于指導特定的Python概念。但是，據我所知，這些資訊是分散的。在本文中，我想對使用id()函數了解六個關鍵Python概念進行系統的回顧。

1.一切都是Python中的對象

作為一種流行的面向對象的程式設計語言，Python在其實作中随處使用對象。例如，諸如整數，浮點數，字元串，清單和字典之類的内置資料類型都是對象。而且，函數，類甚至子產品也被用作對象。

根據定義，id()函數接受一個對象并傳回該對象的辨別，即以整數表示的記憶體位址。是以，我們可以使用此函數來證明Python中的所有對象都是真實的。

>>> import sys
>>> class Foo:
...     pass
...
>>> def foo():
...     pass
...
>>> a_tuple = ('Error', 404)
>>> a_dict = {'error_code': 404}
>>> a_list = [1, 2, 3]
>>> a_set = set([2, 3, 5])
>>> objects = [2, 2.2, 'hello', a_tuple, a_dict, a_list, a_set, Foo, foo, sys]
>>>
>>> for item in objects:
...     print(f'{type(item)} with id: {id(item)}')
...
 with id: 4479354032 with id: 4481286448 with id: 4483233904 with id: 4483061152 with id: 4483236000 with id: 4483236720 with id: 4483128688 with id: 140235151304256 with id: 4483031840 with id: 4480703856

在上面的代碼片段中，您可以看到對象清單中的每個項目都可以在id()函數中使用，該函數顯示每個對象的記憶體位址。

我認為很有趣的以下操作是，作為函數本身，id()函數也應具有其記憶體位址。

>>> print(f'{type(id)} with id: {id(id)}')
 with id: 4480774224

2.變量配置設定和别名

在Python中建立變量時，通常使用以下文法：

var_name = the_object

此過程基本上将在記憶體中建立的對象綁定到特定的變量名稱。如果為變量配置設定另一個變量，例如var_name1 = var_name，會發生什麼？

考慮以下示例。在下面的代碼片段中，我們首先建立了一個名為hello的變量，并為其配置設定了字元串值。接下來，我們通過配置設定之前的變量hello建立了另一個名為world的變量。當我們列印出他們的記憶體位址時，我們發現hello和world都具有相同的記憶體位址，這表明它們是記憶體中的同一對象。

>>> hello = 'Hello World!'
>>> print(f'{hello} from: {id(hello)}')
Hello World! from: 4341735856
>>> world = hello
>>> print(f'{world} from: {id(world)}')
Hello World! from: 4341735856
>>>
>>> bored = {'a': 0, 'b': 1}
>>> print(f'{bored} from: {id(bored)}')
{'a': 0, 'b': 1} from: 4341577200
>>> more_bored = bored
>>> print(f'{more_bored} from: {id(more_bored)}')
{'a': 0, 'b': 1} from: 4341577200
>>> more_bored['c'] = 2
>>> bored
{'a': 0, 'b': 1, 'c': 2}
>>> more_bored
{'a': 0, 'b': 1, 'c': 2}

在這種情況下，變量世界通常稱為變量hello的别名，通過配置設定現有變量來建立新變量的過程可以稱為别名。在其他程式設計語言中，别名非常類似于與記憶體中基礎對象有關的指針或引用。

在上面的代碼中，我們還可以看到，當我們為字典建立别名并修改别名的資料時，該修改也将應用于原始變量，因為在背景，我們修改了記憶體中的同一字典對象。

3.比較運算符：== vs. is

在各種情況下，我們需要比較兩個對象作為決策點，以便在滿足或不滿足特定條件時應用不同的功能。就相等比較而言，我們可以使用兩個比較運算符：==和is。一些新的Python學習者可能會錯誤地認為它們是相同的，但是有細微差别。

考慮以下示例。我們建立了兩個相同項目的清單。當我們使用==運算符比較兩個清單時，比較結果為True。當我們使用is運算符比較兩個清單時，比較結果為False。他們為什麼産生不同的結果？這是因為==運算符會比較值，而is運算符會比較辨別(即記憶體位址)。

正如您所期望的，這些變量引用了記憶體中的同一對象，它們不僅具有相同的值，而且具有相同的辨別。這導緻==和is運算符的評估結果相同，如下面涉及str0和str1的示例所示：

>>> list0 = [1, 2, 3, 4]
>>> list1 = [1, 2, 3, 4]
>>> print(f'list0 == list1: {list0 == list1}')
list0 == list1: True
>>> print(f'list0 is list1: {list0 is list1}')
list0 is list1: False
>>> print(f'list0 id: {id(list0)}')
list0 id: 4341753408
>>> print(f'list1 id: {id(list1)}')
list1 id: 4341884240
>>>
>>> str0 = 'Hello'
>>> str1 = str0
>>> print(f'str0 == str1: {str0 == str1}')
str0 == str1: True
>>> print(f'str0 is str1: {str0 is str1}')
str0 is str1: True
>>> print(f'str0 id: {id(str0)}')
str0 id: 4341981808
>>> print(f'str1 id: {id(str1)}')
str1 id: 4341981808

4.整數緩存

我們在程式設計中經常使用的一組資料是整數。在Python中，解釋器通常會緩存介于-5到256之間的小整數。這意味着在啟動Python解釋器時，這些整數将被建立并可供以後在記憶體中使用。以下代碼片段顯示了此功能：

>>> number_range = range(-10, 265)
>>> id_counters = {x: 0 for x in number_range}
>>> id_records = {x: 0 for x in number_range}
>>>
>>> for _ in range(1000):
...     for number in number_range:
...         id_number = id(number)
...         if id_records[number] != id_number:
...             id_records[number] = id_number
...             id_counters[number] += 1
...
>>> [x for x in id_counters.keys() if id_counters[x] > 1]
[-10, -9, -8, -7, -6, 257, 258, 259, 260, 261, 262, 263, 264]

在上面的代碼中，我建立了兩個字典，其中id_counters跟蹤每個整數的唯一辨別的計數，而id_records跟蹤整數的最新辨別。對于介于-10到265之間的整數，如果新整數的辨別與現有整數不同，則相應的計數器将遞增1。我重複了這個過程1000次。

代碼的最後一行使用清單推導技術向您顯示具有多個同一性的整數。顯然，經過1000次後，從-5到256的整數對于每個整數僅具有一個辨別，如上一段所述。要了解有關Python清單了解的更多資訊，您可以參考我以前關于此的文章：

5.淺層和深層副本

有時，我們需要制作現有對象的副本，以便我們可以更改一個副本而不更改另一個副本。内置的複制子產品為此提供了兩種方法：copy()和deepcopy()，它們分别進行淺拷貝和深拷貝。如果您不知道它們是什麼，讓我們利用id()函數來了解這兩個概念。

>>> import copy
>>> original = [[0, 1], 2, 3]
>>> print(f'{original} id: {id(original)}, embeded list id: {id(original[0])}')
[[0, 1], 2, 3] id: 4342107584, embeded list id: 4342106784
>>> copy0 = copy.copy(original)
>>> print(f'{copy0} id: {id(copy0)}, embeded list id: {id(copy0[0])}')
[[0, 1], 2, 3] id: 4341939968, embeded list id: 4342106784
>>> copy1 = copy.deepcopy(original)
>>> print(f'{copy1} id: {id(copy1)}, embeded list id: {id(copy1[0])}')
[[0, 1], 2, 3] id: 4341948160, embeded list id: 4342107664

我們首先建立了一個名為original的清單變量，它由一個嵌套清單和兩個整數組成。然後，我們分别使用copy()和deepcopy()方法制作了兩個副本(copy0和copy1)。如我們所料，原始的copy0和copy1具有相同的值(即[[0，1]，2，3])。但是，它們具有不同的身份，因為與别名不同，copy()和deepcopy()方法均會在記憶體中建立新對象，進而使新副本具有不同的身份。

淺層副本和深層副本之間最本質的差別是，深層複制将為原始複合對象遞歸建立副本，而淺層複制将在适用的情況下保留對現有對象的引用。在上面顯示的示例中，變量original實際上是一個複合對象(即一個清單嵌套在另一個清單中)。

在這種情況下，使用copy()方法，變量copy0的第一個元素與原始的第一個元素具有相同的辨別(即，相同的對象)。相比之下，deepcopy()方法在記憶體中複制嵌套清單，以使copy1中的第一個元素具有與原始元素不同的辨別。

但是在深度複制中"遞歸"是什麼意思？這意味着如果存在多層嵌套(例如，嵌套在清單中的清單，又嵌套在另一個清單中)，則deepcopy()方法将為每一層建立新對象。請參見以下示例以了解此功能：

>>> mul_nested = [[[0, 1], 2], 3]
>>> print(f'{mul_nested} id: {id(mul_nested)}, inner id: {id(mul_nested[0])}, innermost id: {id(mul_nested[0][0])}')
[[[0, 1], 2], 3] id: 4342107824, inner id: 4342106944, innermost id: 4342107424
>>> mul_nested_dc = copy.deepcopy(mul_nested)
>>> print(f'{mul_nested_dc} id: {id(mul_nested_dc)}, inner id: {id(mul_nested_dc[0])}, innermost id: {id(mul_nested_dc[0][0])}')
[[[0, 1], 2], 3] id: 4342107264, inner id: 4342107984, innermost id: 4342107904

6.資料可變性

Python程式設計中的一個進階主題與資料可變性有關。一般來說，不可變資料是指其值在建立後便無法更改的對象，例如整數，字元串和元組。相比之下，可變資料是指其值在建立後可以更改的那些對象，例如清單，字典和集合。

需要注意的一件事是，通過"更改值"，我們的意思是是否可以更改記憶體中的基礎對象。在我的上一篇文章中可以找到關于資料可變性的詳盡讨論：

不可變與可變

為了本文讨論id()函數的目的，讓我們考慮以下示例。對于不可變資料類型(代碼片段中的整數變量千)，當我們嘗試更改其值時，會在記憶體中建立一個新的整數，這由千變量的新辨別所反映。換句話說，原始的基礎整數對象無法更改。嘗試更改整數隻會在記憶體中建立一個新對象。

>>> thousand = 1000
>>> print(f'{thousand} id: {id(thousand)}')
1000 id: 4342004944
>>> thousand += 1
>>> print(f'{thousand} id: {id(thousand)}')
1001 id: 4342004912
>>> numbers = [4, 3, 2]
>>> print(f'{numbers} id: {id(numbers)}')
[4, 3, 2] id: 4342124624
>>> numbers += [1]
>>> print(f'{numbers} id: {id(numbers)}')
[4, 3, 2, 1] id: 4342124624

如果這讓您感到困惑，讓我們看看可變資料類型發生了什麼—在我們的例子中是清單變量編号。如上面的代碼所示，當我們嘗試更改數字的值時，變量号得到了更新，并且更新後的清單仍具有相同的辨別，進而确認了清單類型的對象的可變性。

總結

在本文中，我們利用内置的id()函數來了解Python中的六個關鍵概念。以下是這些概念的快速回顧：

· Python中的所有内容都是一個對象。

· 我們通過指派建立變量，别名指向記憶體中的相同對象。

· 比較運算符==比較值，而比較運算符正在比較辨別。

· Python解釋器在啟動時會建立從-5到256的整數對象。

· 淺副本和深副本均具有與其原始對象相同的值，但是淺副本僅複制原始對象的嵌套對象的引用。

· 可變對象的值可以在記憶體中更改，而不可變對象不支援值更改。

(本文翻譯自Yong Cui, Ph.D.的文章《Use id() to Understand 6 Key Concepts in Python》，參考：https://medium.com/better-programming/use-id-to-understand-6-key-concepts-in-python-73e0bbd461ec)

請識别以下二維碼關注

部分文字、圖檔來源于網絡，如涉及版權請聯系删除。

for根據ID去重_使用id（）了解Python中的6個關鍵概念1.一切都是Python中的對象2.變量配置設定和别名3.比較運算符：== vs. is4.整數緩存5.淺層和深層副本6.資料可變性不可變與可變總結

1.一切都是Python中的對象

2.變量配置設定和别名

3.比較運算符：== vs. is

4.整數緩存

5.淺層和深層副本

6.資料可變性

不可變與可變

總結

繼續閱讀

for根據ID去重_【基礎必學】對象類型元素數組去重實作方法

for根據ID去重_JS中的for循環——你可能不知道的點。

for根據ID去重_Person Re-ID研究綜述

for根據ID去重_5個小技巧，讓你的for循環瞬間高大上！

for根據ID去重_用Python寫了個檢測文章抄襲，詳談去重算法原理

for根據ID去重_js 對數組的操作，數組對象去重，合并數組

distinct去重多個字段_List集合對象去重及按屬性去重的8種方法-java基礎總結系列第六篇

distinct對兩個字段去重_List怎麼去重？還隻會用Set互換嗎？一篇文章幫你打開“新世界”