我有一個python對象清單,我想按對象本身的屬性排序。清單如下:
>>> ut
[, , , , ,
, ...]
每個對象都有一個計數:
>>> ut[1].count
1L
我需要按計數降序對清單進行排序。
我已經看到了幾種方法,但我正在尋找Python中的最佳實踐。
dupe:stackoverflow.com/questions/157424/…,stackoverflow.com/questions/222752/…,stackoverflow.com/questions/327191/…
為那些在Python中尋找更多排序資訊的人排序。
除了operator.attrgetter("attribute_name")之外,您還可以使用functors作為鍵,如object_list.sort(key=my_sorting_functor("my_key"),進而故意放棄實作。
# To sort the list in place...
ut.sort(key=lambda x: x.count, reverse=True)
# To return a new list, use the sorted() built-in function...
newlist = sorted(ut, key=lambda x: x.count, reverse=True)
有關按鍵排序的更多資訊»;
沒問題。順便說一句,如果Muhuk是對的,并且它是Django對象的清單,那麼您應該考慮他的解決方案。然而,對于排序對象的一般情況,我的解決方案可能是最佳實踐。
在大清單中,使用operator.attrgetter("count")作為鍵可以獲得更好的性能。這隻是這個答案中lambda函數的一種優化(低級)形式。
謝謝你的回答。如果它是一個字典清單,并且"count"是它的鍵之一,則需要如下更改:ut.sort(key=lambda x:x["count"],reverse=true)
最快的方法是使用operator.attrgetter("count"),尤其是如果您的清單中有很多記錄。但是,這可能在操作前版本的Python上運作,是以最好有一個回退機制。您可能需要執行以下操作:
try: import operator
except ImportError: keyfun= lambda x: x.count # use a lambda if no operator module
else: keyfun= operator.attrgetter("count") # use operator since it's faster than lambda
ut.sort(key=keyfun, reverse=True) # sort in-place
在這裡,我将使用變量名"keyun"而不是"cmpun",以避免混淆。sort()方法也通過cmp=參數接受比較函數。
如果對象具有動态添加的屬性(如果在__init__方法之後執行了self.__dict__ = {'some':'dict'},則這似乎不起作用。但我不知道為什麼會不同。
@圖卡:我從來沒有替換過執行個體__dict__。注意,"動态添加屬性的對象"和"設定對象的__dict__屬性"幾乎是正交概念。我是說,因為您的評論似乎意味着設定__dict__屬性是動态添加屬性的要求。
@Tzot:我現在看到的是:github.com/randomatic technologies/goatfish/blob/master/…,這裡使用該疊代器:github.com/tallertechnologies/dishey/blob/master/app.py l28會引發屬性錯誤。也許是因為Python3,但是…
@圖卡:我會用self.__dict__.update(kwargs)代替self.__dict__= kwargs。在任何情況下,也許這是一個python 3問題,因為2.7.3看起來運作正常。稍後我将使用python 3進行研究。
然後就是這樣,這可能意味着類模型的元類在這裡是錯誤的。
@Tzot,它與Django無關,goatfish元屬性隻是一個沒有魔法的原始對象…我已經在一個Python2.7項目中測試過了它,并且看起來像預期的那樣工作。我需要進一步了解這個問題…
@Tzot:如果我了解operator.attrgetter的用法,我可以提供一個具有任何屬性名的函數,并傳回一個已排序的集合。
對于那些想了解更多資訊的人:wiki.python.org/moin/howto/sorting operator_module_函數
讀者應該注意到key=方法:
ut.sort(key=lambda x: x.count, reverse=True)
比向對象添加豐富的比較運算符快很多倍。我很驚訝地讀到了這篇文章(第485頁的"簡而言之,Python")。您可以通過在這個小程式上運作測試來确認這一點:
#!/usr/bin/env python
import random
class C:
def __init__(self,count):
self.count = count
def __cmp__(self,other):
return cmp(self.count,other.count)
longList = [C(random.random()) for i in xrange(1000000)] #about 6.1 secs
longList2 = longList[:]
longList.sort() #about 52 - 6.1 = 46 secs
longList2.sort(key = lambda c: c.count) #about 9 - 6.1 = 3 secs
我的,非常小的,測試顯示第一種速度慢了10倍以上,但書中說一般來說隻有5倍左右。他們說這是因為python(timsort)中使用了高度優化的排序算法。
不過,非常奇怪的是.sort(lambda)比普通的old.sort()更快。我希望他們能解決這個問題。
from operator import attrgetter
ut.sort(key = attrgetter('count'), reverse = True)
面向對象方法
如果适用,最好将對象排序邏輯設定為類的屬性,而不是将其合并到需要排序的每個執行個體中。
這確定了一緻性,并消除了對樣闆代碼的需求。
至少,您應該指定__eq__和__lt__操作,這樣才能工作。那就用sorted(list_of_objects)。
class Card(object):
def __init__(self, rank, suit):
self.rank = rank
self.suit = suit
def __eq__(self, other):
return self.rank == other.rank and self.suit == other.suit
def __lt__(self, other):
return self.rank < other.rank
hand = [Card(10, 'H'), Card(2, 'h'), Card(12, 'h'), Card(13, 'h'), Card(14, 'h')]
hand_order = [c.rank for c in hand] # [10, 2, 12, 13, 14]
hand_sorted = sorted(hand)
hand_sorted_order = [c.rank for c in hand_sorted] # [2, 10, 12, 13, 14]
考慮到最初的IMO用例,這是一個更聰明的解決方案——我認為這應該是投票率最高的答案。
它看起來很像django-orm模型執行個體的清單。
為什麼不在查詢時這樣排序:
ut = Tag.objects.order_by('-count')
是的,但是使用django标記,是以我使用一個内置的工具來抓取特定查詢集使用的标記集,如so:tag.objects.usage for_queryset(query set,counts=true)
向對象類添加豐富的比較運算符,然後使用清單的sort()方法。請參閱python中的豐富比較。
更新:雖然這個方法可行,但我認為TripTych的解決方案更适合您的情況,因為它更簡單。