數(shù)據(jù)挖掘技術(shù)就是利用機(jī)器學(xué)習(xí)統(tǒng)計(jì)數(shù)學(xué)和可視化技術(shù),從大量的數(shù)據(jù)庫(kù)中確認(rèn)出有效的、新穎的、潛在的、有用的以及最終挖掘出可理解模式的高級(jí)處理過(guò)程,數(shù)據(jù)挖掘?qū)嶋H上是數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)過(guò)程。
1、數(shù)據(jù)挖掘:過(guò)程與方法 數(shù)據(jù)挖掘是將人工智能技術(shù)(神經(jīng)網(wǎng)絡(luò),模糊邏輯,遺傳算法等)應(yīng)用到大規(guī)模數(shù)據(jù)中,從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。
數(shù)據(jù)挖掘作為知識(shí)發(fā)現(xiàn)的一個(gè)特定步驟,是知識(shí)發(fā)現(xiàn)的核心。它的目標(biāo)是利用算法,從數(shù)據(jù)中抽取模式,將大容量數(shù)據(jù)轉(zhuǎn)換為有用的知識(shí)和信息。
這里所提的模式包括模型或結(jié)構(gòu)。數(shù)據(jù)挖掘的過(guò)程一般由三個(gè)主要的階段組成:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)采集、結(jié)果表達(dá)和解釋。數(shù)據(jù)挖掘方法有很多種,其中比較典型的有關(guān)聯(lián)分析、序列模式分析、分類分析、聚類分析等。
關(guān)聯(lián)分析是利用關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)挖掘,目的是挖掘出隱藏在數(shù)據(jù)間的相互關(guān)系,關(guān)聯(lián)規(guī)則是描述事物之間同時(shí)出現(xiàn)的規(guī)律的知識(shí)模式。序列模式分析和關(guān)聯(lián)分析相似,是把數(shù)據(jù)之間的關(guān)聯(lián)性與時(shí)間性聯(lián)系起來(lái),側(cè)重點(diǎn)在于分析數(shù)據(jù)間的前后或因果關(guān)系,為了發(fā)現(xiàn)序列模式,不僅需要知道事件是否發(fā)生,而且需要確定事件發(fā)生的時(shí)間。分類分析就是分析示例數(shù)據(jù)庫(kù)中的數(shù)據(jù),為每個(gè)類別做出準(zhǔn)確的描述、建立分析模型或挖掘出分類規(guī)則,把集中的數(shù)據(jù)映射到某個(gè)給定的類上,其輸入集是一組記錄集合和幾種標(biāo)記。與分類分析不同,聚類分析法的輸入集是一組未標(biāo)定的記錄,也就是說(shuō)此時(shí)輸入的記錄還沒(méi)有進(jìn)行任何分類,其目的是根據(jù)一定的規(guī)則,合理地劃分記錄集合,使組之間的差別盡可能大、組內(nèi)的差別盡可能小。
現(xiàn)代物流的新理念包括反應(yīng)快速化、服務(wù)系列化、作業(yè)規(guī)范化、目標(biāo)系統(tǒng)化、手段現(xiàn)代化、組織網(wǎng)絡(luò)化、經(jīng)營(yíng)市場(chǎng)化,這些都離不開(kāi)完善的信息系統(tǒng)的支撐。隨著數(shù)據(jù)量的劇增,數(shù)據(jù)挖掘技術(shù)將成為深化物流信息管理的最有效方法,在解決選址、倉(cāng)儲(chǔ)和配送等基礎(chǔ)物流問(wèn)題方面可以發(fā)揮出很大的作用。 2、選址問(wèn)題 物流中心的選址屬于最小成本問(wèn)題,即求解為運(yùn)輸成本、變動(dòng)處理成本和固定成本等之和的最小化問(wèn)題。選址需要考慮到中心點(diǎn)數(shù)量和中心點(diǎn)如何分布等情況,尤其是多中心選址的問(wèn)題。多中心選址是指在一些已知的備選地點(diǎn)中選出一定數(shù)目的地點(diǎn)來(lái)設(shè)置物流中心,使形成的物流網(wǎng)絡(luò)的總費(fèi)用最小。在實(shí)際操作中,當(dāng)問(wèn)題規(guī)模變得很大,或者要考慮一些市場(chǎng)因素(比如顧客需求量)時(shí),數(shù)學(xué)規(guī)劃就存在一些困難。針對(duì)這一問(wèn)題,可以用數(shù)據(jù)挖掘中的分類樹(shù)方法來(lái)加以解決。
分類樹(shù)的目標(biāo)是連續(xù)的劃分?jǐn)?shù)據(jù),使依賴變量的差別最大。分類樹(shù)的真正的目的是將數(shù)據(jù)分類到不同組或分支中,在依賴變量的值上建立最強(qiáng)劃分。用分類樹(shù)的方法解決這個(gè)問(wèn)題時(shí),通常需要以下四個(gè)方面的數(shù)據(jù):中心點(diǎn)的位置、每個(gè)中心點(diǎn)的業(yè)務(wù)需求量、備選點(diǎn)的位置、在中心點(diǎn)和備選點(diǎn)之間的距離。
通過(guò)分類樹(shù)的方法,不僅確定了中心點(diǎn)的位置,同時(shí)也確定每年各個(gè)地址間物品的運(yùn)輸量,使整個(gè)企業(yè)必要的銷售量得到保證,企業(yè)長(zhǎng)期折現(xiàn)的總成本也會(huì)達(dá)到最小值。 3、配送問(wèn)題 配送問(wèn)題,包括配送計(jì)劃的編制、配送路線的設(shè)計(jì)優(yōu)化以及配送過(guò)程中的配載(混載)問(wèn)題。在許多配送體系中,管理人員需要采取有效的配送策略以提高服務(wù)水平、降低貨運(yùn)費(fèi)用。其中首要的難題,就是車輛的路徑問(wèn)題。車輛路徑問(wèn)題是為一些車輛確定一些客戶的路徑,每一客戶只能被訪問(wèn)一次,且每條路徑上的客戶需求量之和不能超過(guò)車輛的承載能力。
要合理解決這個(gè)問(wèn)題,需要物流設(shè)計(jì)人員考慮到車輛的利用能力,如果車輛在運(yùn)輸過(guò)程中的空載率過(guò)高或整車的運(yùn)力不完全利用,這些無(wú)疑會(huì)增加企業(yè)的運(yùn)輸成本。另外還涉及到車輛的運(yùn)輸能力,這就必須考慮到貨品的規(guī)格大小和利潤(rùn)價(jià)值的大小。
在采取有效的配送策略時(shí)這些因素都必須同時(shí)考慮,這時(shí)如果能夠?qū)︻櫩偷男枨蠛瓦\(yùn)輸路徑綜合起來(lái)進(jìn)行分類,對(duì)整個(gè)配送策略中車輛的合理選擇分派會(huì)有較好的作用。
|