DMA简介

DMA

不是独立的某个外设，而是一个硬件模块

支持DMA的功能

一般对应的，也是按个数来的，对应的叫做多少个通道channel。

【整理】以快递为例来说明DMA的功能

DMA本意解析

DMA==Direct Memory Access==直接存储器访问

Direct：直接，对应的就有间接：之前都是，CPU参与，一点点把数据，从一个地方拷贝，即像搬家一样搬到，另一个地方

很明显，此时，相对时间比较宝贵（比较值钱）的CPU，把时间，就用在（浪费在）拷贝数据了。

Memory：存储器

一般多数都指的是内存

当然，DMA也会涉及到，外设的一些Buffer，数据寄存器等等操作

Access：访问

即操作上面所提到的，存储器

即数据的读写，所以要访问，操作对应的存储器

为何会出现DMA？

所以，尤其很明显可以看出：

之前就是觉得，对于数据拷贝这样，相对低级的，简单的任务，

结果却要，时间比较值钱的CPU，去干这样的“杂货”

就有点浪费CPU的时间了

所以，才出现这个DMA

专门去干，拷贝数据这个活

由此，释放了CPU，CPU就可以去干其他的，相对更加有价值（值钱的）事情了

DMA使用示例

比如，拿uboot中的

S3c2410_nand.c (drivers\mtd\nand) 4513 2013/10/17

中的：

nand_read_buf

为例来说明：

之前就只是CPU去一点点的，慢慢的读数据：

static void nand_read_buf(struct mtd_info *mtd, u_char *buf, int len)
{
	int i;
	struct nand_chip *this = mtd->priv;

	for (i = 0; i < len; i++)
		buf[i] = readb(this->IO_ADDR_R);
}

而如果是改为DMA

则只需要：

CPU去配置好DMA

然后DMA自动会去读数据

就不用CPU再操心了

就不用CPU再费时间去读数据了。

CPU就有空去执行其他更重要的事情了。

另外再举个例子：

之前已经实现的，linux的kernel中的nand flash驱动中的dma的例子：

在对应的hwecc的read函数：

as353x_nand_read_page_hwecc

中，当开启了DMA的READ和普通read的相关代码为：

static int as353x_nand_read_page_hwecc(struct mtd_info *mtd,
			struct nand_chip *chip, uint8_t *buf)
{
...
#ifdef NAF_USE_DMA_READ
	info->len = mtd->writesize;

	/* map CPU buffer(virtual address) to DMA buffer(DMA address) */
	info->txaddr = dma_map_single(	info->device,
									(void *)buf,
									info->len,/* here len is in bytes, not in words !*/
									DMA_FROM_DEVICE);
	if (unlikely(dma_mapping_error(info->device, info->txaddr))) {
		ret = -ENOMEM;
		dev_err(info->device, "DMA read map failed\n");
		goto dma_map_err;
	}

	/* apply DMA slave and client */
	as353x_nand_dma_init_tx(info);

	/* set info for use in call back */
	info->callback_param.client_info = (void *)info;

	/* init values */
	info->txsg.length		= info->len;
	info->txsg.page_link	= 0;
	info->txsg.offset		= 0;
	info->txsg.dma_address = info->txaddr;

	desc = info->txchan->device->device_prep_slave_sg( 
							info->txchan,
							&info->txsg,
							1,
							DMA_FROM_DEVICE,
							DMA_PREP_INTERRUPT);
	if ( unlikely(!desc) ) {
		dev_err(info->device, "Unable to get descriptor for DMA read\n");
		ret = -EBUSY;
		goto prep_sg_err;
	}

	desc->callback = as353x_nand_dma_complete_callback;
	desc->callback_param = &info->callback_param;
	desc->tx_submit(desc);
	/* inform dma controller to start */
	info->txchan->device->device_issue_pending(info->txchan);

	/* inform nand controller to start */
	set_bit32(NAF_CFG_DMA_ON, info->regs + NAF_CONFIG);

	if (unlikely(!wait_for_completion_timeout(&info->done,
								msecs_to_jiffies(1 * 1000)))) {
		dev_err(info->device, "DMA read timeout\n");
		clear_bit32(NAF_CFG_DMA_ON, info->regs + NAF_CONFIG);
		ret = -ENXIO;
		info->txchan->device->device_free_chan_resources(info->txchan);
		info->txchan = NULL;
		AS353XNAND_DBG("len=%d, read=%x\n", info->len, info->txcount);
		as353x_nand_show_reg(mtd);
		goto dma_timeout_err;
	}
#else
	/* none-DMA trasfer */

	/* read page data */
	as353x_nand_read_buf_hwbch4(mtd, buf, 	mtd->writesize);
#endif
...
}

/* for read, from nand to buffer, using DMA_FROM_DEVICE */
static void as353x_nand_dma_init_tx(struct as353x_nand_info *info)
{
	struct dma_client *txclient;
	struct dma_slave *txslave;

	txslave = &info->txslave;
	txclient = &info->txclient;

	txslave->tx_reg = 0;
	txslave->rx_reg = info->dmabase + NAF_FIFODATA;
	txslave->reg_width = DMA_SLAVE_WIDTH_32BIT;
	txslave->dev	= info->device;
	txclient->event_callback 	= as353x_nand_dma_req_tx_chan_callback;
	dma_cap_set(DMA_SLAVE, txclient->cap_mask);
	txclient->slave = txslave;
	dma_async_client_register(txclient);
	dma_async_client_chan_request(txclient);
}

static void as353x_nand_read_buf_hwbch4(struct mtd_info *mtd, 
			u_char *buf, int len)
{
	int i, j;
	u32 *buf_u32 = (u32 *)buf;
	struct as353x_nand_info *info = as353x_nand_mtd_toinfo(mtd);

	/* to words */
	len = BYTE2WORD(len);

	for ( j = ( len / NAF_FIFO_FILLSIZE_IN_WORDS ); j > 0; --j ) {
	    /* wait for fifo to get filled (again) - with high speed flashes this */
	    as353x_nand_wait_until_almost_full(mtd);
	    
	    for ( i = 0; i < NAF_FIFO_FILLSIZE_IN_WORDS; i++ )
	    {
	        *buf_u32 = readl(info->regs + NAF_FIFODATA);
	        ++buf_u32;
	    }
	}

	/* if any words left in FIFO in case of
	non n-times words of NAF_FIFO_FILLSIZE_IN_WORDS */
	for ( i = 0; i < ( len % NAF_FIFO_FILLSIZE_IN_WORDS ); i++) {
	    while (as353x_fifo_isempty(mtd)); /* wait for FIFO is filled */
	    *buf_u32 = readl(info->regs + NAF_FIFODATA);
	    ++buf_u32;
	}
}

可见，当不用DMA时，对应就是去：

对应的读取寄存器中的数据

readl(info->regs + NAF_FIFODATA)

而开启了DMA的话，则是去利用对应的DMA驱动中，申请对应的DMA通道和资源，

然后再去用DMA去传输数据的。

DMA中，对应的指定源地址是：

txslave->rx_reg = info->dmabase + NAF_FIFODATA;

目的地址则是对应的，一点点增加的，每次增加的是32bit=4字节：

txslave->reg_width = DMA_SLAVE_WIDTH_32BIT;

DMA vs 快递

由此可看出，其实DMA，和快递，很类似：

快递：

你的需求是：

想要送东西，从某地到某地

想要通过快递去实现此需求

而之所以选择快递而不自己去送，

有的是自己没时间；

有的是自己有时间，但是成本更高，不值得花在送东西这上面：

比如，寄点东西，本身就只值100元，打算从南京送到北京，快递的话，可能也就10元，20元就够了，而要自己去送，单独火车票，甚至飞机票，都要几百，甚至几千。所以，还是通过快递公司送东西，更划算。

有的是，自己有时间，但是自己的时间，更值钱，不值得花在送东西这上面：

假如你是身家不菲，比如比尔盖茨，即使不嫌弃自己送东西的成本更高，但是也是自己的时间浪费不起，自己的时间，如果花费在送东西上，加起来会值更多的钱，所以不值得自己把宝贵的时间，用在送东西的小事情上面，所以还是选择快递更合适。

等等情况。

对于快递来说：

其优点是：

对于多数用户来说，选择快递寄东西，成本更低，更经济，更划算；

而快递对于用户来说，其所关心的是：

告诉其目的地：对应的，起始的出发地点，在你送东西时，就已经知道了，所以不用再问你

告诉其价格：用户只要支持对应的价格，快递就可以寄送了。

由此类似的DMA：

CPU，就像DMA的用户

CPU的时间很值钱，在有DMA的前提下，

还是把数据拷贝这个事情，交个DMA去做，更经济，更划算。

然后CPU就有空去做其他更值钱，更有意义的事情了。

而对于DMA来说：

其只需要CPU配置好DMA，DMA就可以去干活了，就可以去搬运数据了。

而CPU配置DMA，实际上就是告诉DMA：

搬运数据的起始地址和目标地址：就类似于送快递时的，出发点和目的地

而关于快递时用户要支付的价格，对于CPU来说，表面上是没有去额外给DMA什么补偿的。

只不过，对于整个系统来说，如果你的CPU可以借用DMA去传数据，那么：

系统中是要存在DMA这个硬件（模块，功能）的：这对于设计系统的硬件时，是否增加DMA功能，本身就是成本和效率方面的衡量后的考虑；

不过，CPU使用DMA传输数据，和用户使用快递寄东西，有些方面不太一样：

速度

CPU使用DMA传输数据，往往是为了提高CPU利用率，而结果，更重要的是：

DMA传输数据的话，速度更快，效率更高；

对应的用户选择快递寄东西，有时候，未必是比自己亲自去送，的速度更快，花的时间更短。

但是总的来说，往往是最经济的。

DMA通道个数是有限的

现实中的快递公司，除了大的节假日之外，对于普通用户来说，那处理能力，基本都是无限的。

不会由于你多寄了个东西，快递公司，就忙不过来了。

而现实中的DMA，其资源是有限的：

DMA的个数，是按照通道channel来算的；

同一时刻，一个channel的DMA，只能做一件数据搬家的工作；

而且，往往是：

一个嵌入式系统中，往往很多内部功能模块，都希望有机会用到DMA，但是实际上DMA通道个数有限，

使得很难都满足其需求。

所以，在DMA的使用上，是需要你程序设计者去决定哪个模块使用DMA，然后在对应的驱动中，将数据拷贝的功能，用DMA来实现，以此提升性能的。

不过，另外，一般情况下，也是有对应的DMA驱动，去管理DMA资源，使得只要错开同时使用，也是以可以使得多个模块，都能用到DMA的。但是，往往系统中，某个模块用DMA的话，都是相对比较频繁的，因为是很多时候都在处理数据拷贝，所以往往是某个模块，要是用DMA的话，都是独占单个的DMA通道的。

比如：

系统中，假如只有一个通道的DMA的话，

而Nand Flash中，SD卡驱动中，都希望用到，那么：

你只能根据自己的需求去决定：

假如我的嵌入式系统，物理上的主要的存储设备是Nand Flash

为了提升系统性能，决定把DMA给Nand Flash使用

在保证系统整体的性能相对较好的前提下，而对于SD卡，只是用于存储用户数据，速度稍微慢一点，其也是能接受的。

关于DMA是需要硬件支持的

比如AS3536中，就支持：

AHB1中的8个DMA的channel，16个request：

AHB2中有8个DMAchannel，32个request：

总结

DMA，资源有限，需要合理利用。

且需硬件支持。

转载请注明：在路上 » 【整理】嵌入式外设之DMA

Post Views: 1,662

【整理】嵌入式外设之DMA